Está en la página 1de 62

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE CIENCIAS ECONMICAS CONTABLES Y ADMINISTRATIVAS

ESCUELA ACADMICO PROFESIONAL DE ADMINISTRACIN

Tesina:

Gestin de informacin como soporte en el proceso de toma de decisiones en la Autoridad Administrativa del Agua VI Maran.

Por:
Kimberly Arely Paredes Daz.

Asesor:

Lic. Roxana Elizabeth Mestanza Cacho.


Cajamarca, Per

Mayo del 2013

DEDICATORIA

A Dios por brindarnos salud y entendimiento, por estar presente guiando nuestros pasos para alcanzar nuestros ideales.

A mi familia, que me brinda apoyo y amor incondicional.

A quienes pusieron toda su confianza, para poder seguir nuestras metas trazadas y hacerlas realidad.

AGRADECIMIENTO

Expreso mi agradecimiento ante todo a Dios, por el regalo supremo de la vida. Al personal de Autoridad Administrativa del Agua VI Maran que me brind su apoyo al brindarme informacin para desarrollar el presente estudio. As mismo agradecer a la Lic. Roxana Elizabeth Mestanza Cacho, que como mi asesora me brind su apoyo constante, informacin y gua factores indispensables para la realizacin de este trabajo. Para concluir agradecemos a todos aquellos que aunque no han sido mencionados han colaborado de una u otra forma en el logro del presente trabajo.

PRESENTACIN Una de las tareas ms significativas que la universidad cumple en la actualidad, es contribuir en la investigacin de manera efectiva y permanente, a travs de una adecuada orientacin y motivacin. El desarrollo de este tema nos permite afirmar, que este trabajo de investigacin pueda servir como una herramienta de informacin y apoyo para futuros trabajos relacionados con el tema. Modestamente espero haber cumplido con los objetivos planeados, y de esta manera cubrir con sus expectativas.

RESUMEN

La cobertura de este estudio es analizar la Gestin de la informacin como el nico camino seguro para hacer competitiva a una organizacin.

La presente tesina tiene como objetivo transmitir al lector lo valioso que representa el procesamiento de la informacin adquirida en la organizacin haciendo el uso de las herramientas de Gestin de la informacin esto puede incrementar de forma sustancial el proceso de toma de decisiones.

La AUTORIDAD ADMINISTRATIVA DEL AGUA ha centrado la atencin en optimizar operaciones e incrementar su competitividad. Y mientras la organizacin trata de mejorar la eficacia de sus operaciones, se hace obvia la necesidad de dedicar ms tiempo a analizar lo que ocurre y a hacer predicciones y planes al futuro, en lugar de tener a sus empleados siempre pendientes para intentar resolver problemas operativos basados en el historial y reaccionando ante imprevistos. El presente estudio trata de una investigacin asociada a una estructura de Gestin de la informacin de utilidad para la gestin de la organizacin. Se inicia con una presentacin o introduccin donde se explica el problema en cuestin, se establece la hiptesis que presenta una alternativa para dar soporte en la toma de decisiones. Luego se establecen los objetivos que proponen una implementacin de una estructura basada en Gestin de la informacin. La justificacin muestra la importancia y los beneficios de alcanzar este soporte basado en Gestin de la informacin. Posteriormente el marco terico comienza con teoras que sirven de fundamento para la investigacin, influencia de datos en la toma de decisiones, modelo del sistema: Informacin, Teora sobre sistemas de informacin, Sistemas de Apoyo a las decisiones, Sistema de administracin de base de datos.

INTRODUCCIN Las ingentes cantidades de datos generados cada da en las empresas estn dispersos en diferentes almacenes y se gestionan por plataformas diferentes. En muchas ocasiones estos datos son de difcil acceso y estn contaminados por otros inservibles. Al no disponer de soluciones analticas, las bases de datos utilizadas que han conseguido almacenar informacin de calidad no pueden rentabilizarse al mximo. Hoy en da los ejecutivos de alto nivel y los directores de organizaciones, deben enfrentarse a situaciones de cualquier tipo de conflictos, en tal sentido, el asesoramiento acerca de la informacin es especialmente aplicable en la organizacin. Luigi Valds Buratti, especialista en el mbito estratgico organizacin, indica: Los recursos econmicos bsicos, tierra, trabajo y capital, han sido substituidos por el conocimiento. La nueva forma de generar riqueza est representada por la oportunidad, la creatividad, el valor agregado, la tecnologa, la informacin, la capacidad de respuesta, la productividad, la innovacin y cooperacin, todas ellas aplicaciones del conocimiento.

Buscar que la Gestin de la informacin acte como un factor estratgico para una organizacin, que no es otra que proporcionar informacin privilegiada para responder a los problemas.

LA GESTIN DE LA INFORMACIN ayuda a las organizacin a comprender, analizar e incluso prever lo que va a pasar en el entorno general y en la organizacin. Su uso permite convertir datos en informacin til y relevante para distribuirla a las personas que la necesiten en el momento oportuno, a fin de que puedan tomar decisiones adecuadas en el momento oportuno y sobre todo bien fundamentadas. Permite combinar datos procedentes de fuentes diversas y obtener una visin integrada, completa y totalmente actualizada.1 El gran reto por tanto de las organizaciones es conseguir una gestin de los datos que los transforme en informacin inteligente que sea la clave para la toma de decisiones.
1

www.sap.com/spain/contactsap

CAPTULO I

EL PROBLEMA DE INVESTIGACION

1.1. Definicin y delimitacin del problema:

La Autoridad Nacional del Agua (ANA) VI maran, es el ente rector y la mxima autoridad tcnico-normativa del Sistema Nacional de Gestin de los Recursos Hdricos, as tambin, un organismo especializado adscrito al Ministerio de Agricultura.

En Cajamarca tenemos al rgano desconcentrado: Autoridad Administrativa del Agua (AAA) VI Maran. El cual realiza la gestin en bsqueda de asegurar la calidad, cantidad y disponibilidad del recurso hdrico. La Autoridad Administrativa del Agua, maneja grandes volmenes de informacin, ya que tiene el control de 11 ALAs (Administracin local del agua); para el manejo de estas se requiere una gestin adecuada y completa.

En el rea de administracin se realizan funciones de la naturaleza de dicha rea, bajo las siguientes lneas generales: manejo de recursos monetarios, materiales y personal.Para el desarrollo de las actividades el rea de administracin presenta algunas dificultades en cuanto al manejo de la informacin; ella ocasiona demoras y problemas en lo que respecta al cumplimiento eficiente de las funciones.

A pesar de que la AAA VI Maran tiene la infraestructura tecnolgica bsica, no existe una adecuada gestin de informacin, debido a que sus sistemas actuales no soportan el manejo de grandes volmenes de informacin. Ello muestra un gran problema al momento de utilizar informacin para emplearla en la toma de decisiones. 7

Por lo expuesto se puede concluir que hoy en da las organizaciones deben emplear la informacin para generar conocimiento til dirigido a la mejora de sus procesos, la informacin es un recurso muy valioso en las organizaciones, y debe utilizarse como herramienta para la toma de decisiones. Es por ello que se requiere de la gestin adecuada de informacin que permita a la informacin til viajar a las distintas unidades y con ello tomar las decisiones adecuadas.

1.2. Formulacin del problema: La gestin de la informacin, permitir un adecuado proceso de toma de decisiones en la Autoridad Administrativa del Agua VI Maran? 1.3 Justificacin de la investigacin: LA GESTIN DE LA INFORMACIN ayuda a las organizacin a comprender, analizar e incluso prever lo que va a pasar en el entorno general y en la organizacin. Su uso permite convertir datos en informacin til y relevante para distribuirla a las personas que la necesiten en el momento oportuno, siempre que la necesiten, a fin de que puedan tomar decisiones adecuadas en el momento oportuno y sobre todo bien fundamentadas. Permite combinar datos procedentes de fuentes diversas y obtener una visin integrada, completa y totalmente actualizada.2

Es por ello que se desarrolla la investigacin acerca de la importancia de manejar adecuadamente la informacin, buscando tecnologas, a nuestro alcance y cuyo provecho puede ser muy ventajoso. En una entrevista el administrador, reflejo su preocupacin por el tema del intercambio de informacin entre las ALAs (Autoridad Local del Agua) y la AAA VI MARAON; puesto que existe deficiencias al momento de codificar, procesar y almacenar la informacin.

www.sap.com/spain/contactsap Revisado: 07/11/11

Los resultados de la presente investigacin permitirn la integracin y optimizacin de la informacin disponible para responder a los problemas en el proceso de gestionar la informacin, eliminacin de islas de informacin y lograr la gestin adecuada para el manejo de rganos desconcentrados. Con la presente investigacin se contribuir al desarrollo de la organizacin, una

metodologa que permita analizar y plantear alternativas de solucin para los problemas existentes.

Los beneficios que se obtendrn son mltiples: Toma de decisiones informadas e inteligentes, actualizar datos esenciales, eficientes procesos en el propio ambiente de trabajo, reducir la incertidumbre. Los beneficios que se obtendrn son los siguientes: Tomar decisiones informadas e inteligentes respecto a la forma en que su organizacin o negocio se ejecuta. Podr actualizar datos esenciales de manera automtica. Eficientes procesos en el propio ambiente de trabajo, que prestan a una organizacin ventaja competitiva que se necesita para tener xito. Filtrar informacin que permitir saber qu tipo de cambios se darn y as reducir la incertidumbre lo que llevar a trabajar eficientemente.

1.4 Objetivos de la investigacin: 1.4.1. Objetivo general: El objetivo de la presente tesina es realizar la propuesta de implementacin de una metodologa para la gestin de la informacin, que responda a los requerimientos de informacin del reade administracin de la Autoridad Administrativa del Agua VI Maran. 1.4.2. Objetivos especficos: Disear una metodologa que permita que la informacin relevante se encuentre a disposicin de los interesados. Desarrollar el proceso de planificar las comunicaciones usando recursos disponibles. 9

Disear formatos de reportes que faciliten la toma de decisiones paralos usuarios finales de la informacin.

1.5.-Hiptesis

H1: LaGestin de la informacin en la Autoridad Administrativa del Agua servir como soporte en la toma de decisiones para la organizacin.

1.6 Identificaciny Operativizacinde variables 1.6.1 Variables Independientes. Diseo de una Estructura basada en Gestin de la informacin. 1.6.2 Variables Dependientes. Toma de decisiones

1.7 Limitaciones de la Investigacin


Escasa informacin documentada sobre xito de Instituciones pblicas, que utilizaron Gestin de la informacin.

10

CAPTULO II MARCO TERICO


2.1 Orgenes y las bases conceptuales de la gestin de la informacin La palabra informacin proviene del latn clsico y se cree que era deuso comn (Adam, 1973). El trmino informatioes una sustantivacin delverbo informare, que por ser transitivo encuentra su mayor generalidaden la expresin aliquid informare. Esto ltimo significa literalmente darforma a un objeto y seala hacia el desarrollo de un proceso, es decir, haciala gestin; por lo tanto, en su propia gnesis existe una relacin entreambos trminos. La GI (gestin de la informacin), segn Ponjun (2003), es el proceso mediante el cual seobtienen, despliegan o utilizan recursos bsicos (econmicos, fsicos, humanoso materiales) para manejar informacin dentro y para la sociedada la que sirve. Tiene como elemento bsico la gestin del ciclo de vidade este recurso y se desarrolla en cualquier organizacin. La GI, debidoal impetuoso desarrollo de las TIC (tecnologas de la informacin), sucede cada vez ms en entornosvirtuales, como portales y plataformas web, y hace uso de herramientasinformticas cada vez ms sofisticadas y, al mismo tiempo, ms amigablesy accesibles, por lo que los propios usuarios se convierten a menudoen gestores de informacin. La primeras posturas sobre las ciencias de informacin aparecen enla dcada de los sesenta, pero slo a partir de los aos ochenta, puedehablarse del surgimiento de la gestin de la informacin como disciplinaprctica, la cual replantea el mercado del trabajo del profesional dela informacin y demanda un nuevo tipo de profesional con importantesresponsabilidades en el diseo y el desarrollo de sistemas de informacinen las organizaciones. Guzmn (2005) desbroza el camino sobre las principales posturasrelacionadas con el manejo de la informacin. Segn la autora (citandoa Moreira, 1995), el artculo que abord las ciencias de la informacincomo disciplina independiente fue Information Storage and Retrieval:tools, elements, theories, de Becker y Hayes, publicado en 1963, al referirlos resultados sobre los primeros cursos impartidos sobre este tema en laUniversidad de California, Los ngeles.

11

Otro trabajo fundacional es el de Robert S. Taylor, de 1966, publicadoen el primer volumen del AnnualReview of InformationScience and Technology, en el cual el autor hace una revisin del trabajo en el rea, antesde 1965 con el fin de establecer un marco para el anlisis de las tendenciaspredominantes en aquel momento.

Taylor (1996) considera incipiente las ciencias de la informacin, cuyosfundamentos se enriquecen en la convergencia de otras disciplinas. El artculo de Borko InformationScience: Whatisit?, de 1968,tuvo un papel sustancial en la definicin de los fundamentos de las cienciasde la informacin y su manejo. Ofrece una definicin exhaustivasobre la naturaleza y los conceptos de la ciencia de la informacin, apartir de la sntesis de las ideas de Robert Taylor, que se define como una ciencia interdisciplinaria que investiga las propiedades y el comportamientode la informacin, las fuerzas que gobiernan su flujo ysu uso, adems de las tcnicas, tanto manuales como mecnicas, paraprocesar la informacin para su mejor almacenamiento, recuperacin ydiseminacin.

El autor propone una vinculacin dialctica entre informacin y conocimiento;seala que las ciencias de la informacin, como disciplina,determinan, entre sus objetivos, proveer un corpus que posibilite mejorarel quehacer de diversas instituciones y procesos dedicados a la acumulaciny transmisin del conocimiento.

Existe un gran nmero de estas instituciones y medios relacionadosque comprenden desde los libros para empaquetar el conocimiento; las escuelaspara la enseanza del saber acumulado por muchas generaciones;las bibliotecas para el almacenamiento y diseminacin de la informacin;el cine y la televisin para la proyeccin visual del conocimiento; los peridicospara la comunicacin escrita sobre los ltimos avances en la tcnicay los campos especializados; as como las conferencias para la comunicacin oral de la informacin.

Shera (1968) analiza el proceso de transicin de la documentacin alas ciencias de la informacin, las relaciones entre dichas disciplinas entrminos de sus definiciones tericas y las condiciones acadmicas parala ascensin de la nueva ciencia en el

12

escenario de los aos sesenta. Elautor cita los planteamientos expuestos en la conferencia Special LibrariesAssociation, en 1967, por Rees y Saracevic, quienes sealan que lasciencias de la informacin son una rama de la investigacin que toma su sustancia, mtodos y tcnicas de diversas disciplinas para llegar a la comprensinde Otten y Debons (1970), en su artculo Towards a metascience of information: Informatology, sealan que existen argumentos que sugierenque la informacin y las operaciones que se realizan con ella, constituyenfenmenos y stos proveen las bases para la formacin de una meta ciencia de la informacin, cuya funcin la dictan: a) la necesidad de una basecomn sobre la que todas las ciencias y tecnologas especializadas, orientadasa la informacin, pueden ser comprendidas y estudiadas; b) un marcode trabajo y un lenguaje comunes a todos los cientficos y tecnlogos, preocupados de algn modo por el fenmeno informacin; y c) la necesidadde integrar varias teoras que se ocupan de ste, as como de la relacin delhombre con la informacin. GlynnHarmon (1971), en su artculo Ontheevolution of InformationScience, analiza la ascensin y el desarrollo de la ciencia de la informacindentro de un marco disciplinario; concibe esta rea temtica como una delas disciplinas de moderna generacin, pertenecientes o relacionadas conlas reas de la comunicacin y las ciencias del comportamiento, que emergierondurante la segunda guerra mundial, y examina esta relacin comoparte del desarrollo interno del campo.

Paralelamente a los conceptos emergentes sobre las ciencias de lainformacin, se desarrollaban, a escala mundial, las denominadas TIC,que son, en buena medida, la explicacin de muchos de los sucesos anteriores.

Esta etapa se caracteriza por la influencia de los avances de las nuevastecnologas en los mtodos de tratamiento y difusin de la informacin:en primer lugar las computadoras y luego las telecomunicaciones. Estosdispositivos automatizados posibilitan el acceso a la informacin desdecualquier punto del planeta, cada vez en menos tiempo y con un costo msreducido, lo que aumenta su eficacia y eficiencia en un proceso de continuo perfeccionamiento y multiplicacin. El desarrollo de esta coyuntura, junto a la evolucin de la nueva cienciay el acelerado proceso de produccin de informacin, conocido tambin como bomm de la informacin,

13

crearon condiciones reales y objetivaspara que en las dcadas de los aos ochenta y los noventa, se asistiera a laaparicin de lo que se denomin GI como aplicacin prctica de la cienciasde la informacin.

Aparece entonces la figura de gerencia de recursos de informacin,cuyo propsito es ofrecer mecanismos que permitan la organizacin, planeacin,adquisicin, produccin, transmisin y control al menor costoposible, de datos e informacin con una calidad, exactitud y actualidadsuficientes para servir a los objetivos y el crecimiento continuo de las organizaciones(Burk y Horton, 1998).

A partir de este momento, se manifiesta, claramente, que la informacines un recurso importante para la consecucin de los objetivos decualquier organizacin y que, por tanto, debe administrarse con criterioseconmicos. Al mismo tiempo, se desarrollan ms los sistemas y las redesde informacin como instrumentos necesarios para procesar y aplicarsta, y se convierten en herramientas fundamentales de su gestin.

Los sistemas de informacin tienen como objetivo satisfacer lasnecesidades de sus usuarios mediante la integracin de los flujos de informacinexistentes en las organizaciones. Las tecnologas, los sistema ylas redes de informacin, juntos, generan una revolucin en las organizaciones,que favorece el acceso rpido a la informacin interna y externa,formal e informal; previenen las duplicaciones; producen el mximo rendimientoen el uso de la informacin existente; y evitan su territorialidad. DEFINICION DEL SISTEMA DE INFORMACION

Ostal Garca (2006), en su estudio etimolgico de la palabra informacin,concluye que sta es: a) dar forma a un objeto; b) dar forma a unaidea; c) instruir a un aprendiz; d) relatar un suceso; e) difundirlo masivamente.En su acepcin c esta palabra se relaciona de nuevo con la acepcinde aprendizaje. Finalmente, este autor describe como informacin algoms cercano al aspecto tecnolgico: La informacin que fluye por un sistema distribuido es el conjunto de sus transferenciasde informacin. Cualquiera de ellas se produce cuando, en relacin a ese sistemadistribuido, una de sus partes que se encuentra en determinado estado (entre variosposibles) informa

14

de que otra parte se encuentra en determinado estado (entre variosposibles) en virtud de alguna correlacin que se ha establecido entre estados desendas partes. Andreu, Ricart y Valor (1995) definen un sistema de informacincomo unconjunto integrado de procesos, principalmente formales, desarrollados en un entornousuariocomputadora que, sobre un conjunto de datos estructurados (bases de datos)de una organizacin, recopilan, procesan y distribuyen selectivamente la informacinnecesaria para la operatividad habitual de la organizacin y las actividades propias dela direccin de la misma (Muoz Cruz, 2005).

Esta definicin refleja la fuerte influencia del componente tecnolgicopara el procesamiento y trabajo con la informacin. 2.2 Influencia de las TIC en la gestin de la informacin

Segn Moreira (1999), la contribucin de las TIC hace factibles losobjetivos de la organizacin documental, y da acceso a todos los documentosexistentes, con seguridad y un distanciamiento mnimo, deforma organizada, con un manejo fcil, rapidez de uso y para audienciasmasivas.

As, el objetivo bsico de la gestin de informacin es organizar y poneren uso los recursos de informacin de la organizacin (tanto de origenexterno como interno), para permitirle operar, aprender y adaptarse a loscambios del ambiente.

Los actores principales en la gestin de informacin son los miembrosde las organizaciones tanto como proveedores como usuarios, almismo tiempo, debido a la facilidad en el uso de herramientas para lacaptura, el procesamiento y anlisis de informacin, lo que acerca cadavez ms a las lites informticas a los diferentes actores dentro de lasorganizaciones.

2.3 Procesos principales de la gestin de informacin

Los procesos principales de la gestin de informacin son: la identificacinde las necesidades de informacin; la definicin de la disponibilidady accesos a las fuentes informativas, su organizacin y almacenamiento; elanlisis y monitoreo continuo a travs

15

de diferentes modelos; el desarrollode productos y servicios, su distribucin y uso compartido, base de lacreacin del conocimiento estructurado para la organizacin y, por tanto,fundamento de la gestin del conocimiento (Moreira, Mndez y Rodrguez, 1999). 2.4. Dimensiones y principios de la GI: Ponjun (2004) plantea los aspectos fundamentales de GI y losdescribe con amplitud. De forma resumida, se puede sealar que las dimensionesde la GI, segn esta autora, son: el ambiente, los procesos, las personas, la tecnologa, la infraestructura y los productos y servicios.

Como principios menciona dos: la teora de sistemas y la teora del ciclo de vida de la informacin.

Segn Moreira, Mndez y Rodrguez (1999), la gestin del conocimiento,para su mejor desempeo, debe desarrollarse como tendencia apartir de la GI. Sin embargo, este proceso es mucho ms que una tendencia,ya que la relacin entre la GI y la GC es un sistema integrado porcontenidos, tecnologas y conocimientos, en el cual se maneja la informacincomo una oportunidad hasta convertirla en patrones generadores

deresultados que se reflejen en el mejoramiento de procesos y la creacin denuevos productos y servicios para las organizaciones.

En conclusin, la informacin y el conocimiento son parte de un mismo proceso complejo vinculado por conceptos como aprendizaje, inteligencia y tecnologas. Los flujos de informacin y la generacin de nuevosconocimientos dependen de modelos de comportamientos informacionalesy cognitivos de las personas. Buscar, almacenar, procesar, analizar,representar, compartir y distribuir informacin y conocimiento debe ser una labor relacionada con la motivacin y el estmulo de los usuarios y, porende, con la creacin de competencias y habilidades que se han de impulsarde manera sistemtica.

La informacin y el conocimiento se transmiten eintercambian a menor costo para una cantidad mayor de usuarios a la vez,de modo estructurado y formalizado y a travs del uso de las tecnologasde informacin. Los soportes de la informacin pueden ser muy diversos;el soporte fundamental del conocimiento son las personas.

16

2.5 Indicadores de la Gestin de la Informacin: Orr y Persson (2003).

Indicadores de procesos Comparacin con el uso anterior de la informacin. Comparacin con la satisfaccin anterior del usuario. Facilidad para la distribucin de la informacin. Eficiencia. ndice de innovacin. Reporte de actividades relacionadas con el manejo de informacin. Calidad de informacin. Tiempo de respuestas. Ganancias obtenidas. Soporte para la gestin. Solucin de incidentes. Velocidad de transferencia. Mtodos de trabajo. Indicadores de personal Actitud para compartir la informacin. Utilizacin de la informacin. Evaluacin de su propia contribucin. Retencin del personal. Satisfaccin del personal. Expertos disponibles en GI. Mejoramiento de los resultados Satisfaccin de las condiciones

laborales. Establecimientos de redes con otras organizaciones. Nmero de usuarios participantes en compartir conocimiento.

laborales. Indicadores tecnolgicos Nmero de sitios/pginas consultadas. Disponibilidad de los sistemas de informacin. Clasificacin y catalogacin de la informacin. Espacios disponibles para propuestas de innovacin. Documentos usados. Accesos. Suficiencia del sistema. Accesibilidad del sistema. Usabilidad del sistema. Usabilidad de la informacin.

17

Breve historia de las diferentes herramientas de Gestin de la informacin.

60s Informes Batch 70s Primeros DSS(Decision Support Systems) y EIS(Executive Information Systems) 80s Acceso a datos

La informacin es difcil de entrar y analizar, poco flexible, se necesita programar cada peticin.

Basados en terminal, no integrados con el resto de herramientas. Proporciona a los directivos acceso a la informacin de estado y sus actividades de gestin.

Herramientas de consultas

e informes,

herramientas de anlisis integradas 90s

hojas de clculo, interfaces grficos e integrados, fciles de usar.


Almacenes de datos y Herramientas OLAP

Interfaces multidimensionales. Agregaciones y combinaciones de datos complejas, con objetivos de anlisis estratgicos.

00s Herramientas de Minera de datos y Simulacin.

Los datos son analizados en diferentes vistas.

Permiten extraer patrones, modelos, descubrir relaciones, reglas o regularidades, patrones

tendencias, etc.

Producen

(conocimiento).
Tabla 03: Evolucin de las Herramientas de Gestin de la informacin. Fuente: (Laudon Kenneth, 2004)

18

GRAFICO N 03: Conocimiento en las ciencias de la informacin.

Esquema sobre el conocimiento desde el punto de vista de las ciencias de la informacin, cmo se genera y cmo se aplica

Fuente: El conocimiento organizativo y la gestin de la calidad (Benavides y Quintana, 2003).

En ese sentido, Benavides seala que cualquier organizacin se enfrenta a diferentes retos a la hora de almacenar los datos que dificultan alcanzar una Gestin de la informacin a nivel de organizacin. La informacin normalmente se encuentra en lo que se podran denominar silos de informacin, que pueden ser utilizados por distintas unidades de negocio e incluso se pueden encontrar en plataformas dispares. 2.3.CICLO DE LA GESTIN DE LA INFORMACIN Para Pea (2006) la Gestin de la informacines mucho ms que una actitud o una tecnologa a disposicin de las organizaciones; es un marco de referencia para la gestin del rendimiento, un ciclo continuo por el cual las compaas definen sus objetivos, analizan sus progresos, adquieren conocimiento, toma decisiones, miden sus xitos y comienzan el ciclo nuevamente. En tal sentido, ayuda a los gerentes a tomar mejores decisiones ms rpidamente en los niveles estratgico y operativo. El ciclo se compone de cuatro fases o etapas a saber: anlisis, reflexin, accin y medicin. Para lo cual el anlisis comienza por determinar los datos a recopilar, la seleccin se basa en un entendimiento bsico y en supuestos de cmo opera la

19

organizacin, considerando aquello que es relevante a los clientes, proveedores, empleados, los factores que afectan los insumos, entre otros.3

2.4 Componentes principales de un sistema de inteligencia denegocio.

2.4.1 Componentes convencionales: A. Datawarehouse De acuerdo con W. H. lnmon, quien es considerado como el padre del Data Warehouse: Un Data Warehouse es un conjunto de datos integrados orientados a una material que varan con el tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de una administracin." De acuerdo con algunas organizaciones, el Data Warehouse es una arquitectura. Para otras, es un depsito semnticamente consistente en datos (separados y que no interfieren con los sistemas operativos y de produccin existentes) que Ilenan por completo los diferentes requerimientos de acceso y reporte de datos. Para algunos otros, el Data Warehouse es un proceso continuo que mezcla los datos de varias fuentes heterogneas, incluyendo datos histricos y adquiridos para soportar la constante necesidad de consultas estructuradas y/o ad hoc, reportes analticos y soporte de decisiones. As como hay gran divergencia para establecer una definicin precisa de un Data Warehouse, hay un claro consenso de que la tecnologa del Data Warehouse es un ingrediente esencial en el conjunto de soluciones para el soporte de decisiones en una organizacin.4

http://www.publicaciones.urbe.edu/index.php/cicag/article/viewArticle Dr. Rafael Belloso Chacn, Venezuela.Revisado: 15/07/11

Cristhian Herrera experiencia en el rea de desarrollo de software y en la docencia acadmica. Dentro de la construccin de software he manejado las etapas de: anlisis, diseo, personalizacin e implementacin de aplicaciones bajo ambientes Cliente Quito (Ecuador) 30/10/2007

20

GRAFICO 05: Datawarehouse

Fuente: http://www.adictosaltrabajo.com/tutoriales/tutoriales.php?pagina=datawarehouse

AtomicLayer

Centro del Data warehouse, nivel de informacin detallada, excelente fuente para realizar consultas e informes, aplicaciones OLAP y Dataminning.A este nivel se puede incluir campos con los datos primarios, informacingeoreferencial y toda la que se aplique a nivel detallado. Todos los anlisis yusos posteriores de la informacin son derivados de la estructura de lainformacin atmica. Operacional Data Store (ODS)

Es la base de datos orientada a temas, integrada, variante en el tiempo, no voltil usada para soportar el proceso detoma de decisiones tcticas.5

Referenciado en la tesis La Gestin de la informacin y su aplicacin en algunas empresas ubicadas en Medelln Sonia Cardona Ros

21

Staginrea

rea donde se almacenan los datos antes de ingresar al Datawarehouse. Su objetivo es extractar la informacin de los sistemas fuentes, hacer depuracin de informacin y realizar procesos de transformacin previos a la alimentacin de las estructuras de nivel detallado.6 B. Data Mart7 Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de undatawarehouse, o integrar por s mismo un compendio de distintas fuentes de informacin. Por tanto, para crear el datamart de un rea funcional de la organizacin es preciso encontrar la estructura ptima para el anlisis de su informacin, estructura que puede estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designacin de una u otra depender de los datos, los requisitos y las caractersticas especficas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts: DatamartOLAP Se basan en los populares cubos OLAP, que se construyen agregando, segn los requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

Referenciado en la tesis La Gestin de la informacin y su aplicacin en algunas empresas ubicadas en Medelln Sonia Cardona Ros
7

http://www.sinnexus.com/business_intelligence/datamining.aspx

Revisado: 07/05/12

22

Datamart OLTP Pueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales) aprovechando las caractersticas particulares de cada rea de la organizacin. Las estructuras ms comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de quieres (aunque slo es posibles en algunos SGBD avanzados, como Oracle). Los datamarts que estn dotados con estas estructuras ptimas de anlisis presentan las siguientes ventajas: Poco volumen de datos Mayor rapidez de consulta Consultas SQL y/o MDX sencillas Validacin directa de la informacin Facilidad para la historizacin de los datos

23

Componentes analticos de alto impacto.

Adems de la tecnologa bsica explicada anteriormente, la Gestin de la informacin puede ser apoyada por tcnicas y tecnologas de alto impacto en el negocio que determinan el centro del anlisis de estas soluciones (BI). Spatial Anlisis

Orientados al manejo espacial, all se representainformacin relevante para el negocio, como puede ser ubicacin geogrfica dedonde viven los clientes, y como estn localizados con respecto al resto delmundo. 8 C. Datamining (Minera de datos) El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o

semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento9

M. Weis, NitinIndurkhya, Tong Zhang, Fred J. Damerau. Text Mining: Mtodos de prediccin para analizar la

informacin no estructurada. Editorial Springer,2005.


9

http://www.sinnexus.com/business_intelligence/datamining.aspx

Revisado: 07/09/12

24

Son herramientas que permiten identificar tendencias ycomportamientos, no slo para extraer informacin, sino tambin paradescubrir las relaciones en bases de datos que pueden identificarcomportamientos que no muy evidentes. D. Agents

Son redes neuronales que encargadas de localizar tendencias endiferentes variables, compararlos con las reglas de negocio y generar reacciones frente a un conjunto de circunstancias, reportando excepciones. Por ejemplo: analizan tendencias como la demanda de productos basados en las ventas, el efecto de las promociones, el nmero de clientes, etc.10 E. Sistemas de Soporte a la Decisin (DSS)11 Un Sistema de Soporte a la Decisin (DSS) es una herramienta enfocada al anlisis de los datos de una organizacin. En principio, puede parecer que el anlisis de datos es un proceso sencillo, y fcil de conseguir mediante una aplicacin hecha a medida o un ERP sofisticado. Sin embargo, no es as: estas aplicaciones suelen disponer de una serie de informes predefinidos en los que presentan la informacin de manera esttica, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas. Informes dinmicos, flexibles e interactivos, de manera que el usuario no tenga que ceirse a los listados predefinidos que se graficaron en el momento de la implantacin, y que no siempre responden a sus dudas reales. No requiere conocimientos tcnicos. Un usuario no tcnico puede crear nuevos grficos e informes y navegar entre ellos, haciendo drag&drop o drillthrough. Por tanto, para examinar la informacin disponible o crear nuevas mtricas no es imprescindible buscar auxilio en el departamento de informtica.
10
11

Referenciado en la tesis La Gestin de la informacin y su aplicacin en algunas empresas ubicadas en Medelln

Sonia Cardona Ros

http://www.sinnexus.com/business_intelligence/datamining.aspx

Revisado: 07/10/11

25

Rapidez en el tiempo de respuesta, ya que la base de datos subyacente suele ser un datawarehouse corporativo o un datamart, con modelos de datos en estrella o copo de nieve. Este tipo de bases de datos estn optimizadas para el anlisis de grandes volmenes de informacin

Integracin entre todos los sistemas/departamentos de la compaa. El proceso de ETL previo a la implantacin de un Sistema de Soporte a la Decisin garantiza la calidad y la integracin de los datos entre las diferentes unidades de la organizacin. Existe lo que se llama: integridad referencial absoluta.

Cada usuario dispone de informacin adecuada a su perfil. No se trata de que todo el mundo tenga acceso a toda la informacin, sino de que tenga acceso a la informacin que necesita para que su trabajo sea lo ms eficiente posible.

Disponibilidad de informacin histrica. En estos sistemas est a la orden del da comparar los datos actuales con informacin de otros perodos histricos de la compaa, con el fin de analizar tendencias, fijar la evolucin de parmetros de negocio.

Tipos de Sistemas de Soporte a Decisiones12 Sistemas de informacin gerencial (MIS) Los sistemas de informacin gerencial (MIS, Management

InformationSystems), tambin llamados Sistemas de Informacin Administrativa (AIS) dan soporte a un espectro amplio de tareas organizacionales, encontrndose a medio camino entre un DSS tradicional y una aplicacin CRM/ERP implantada en la misma compaa. Sistemas de informacin ejecutiva (EIS) Los sistemas de informacin ejecutiva (EIS,

ExecutiveInformationSystem) son el tipo de DSS que ms se suele


12

http://www.sinnexus.com/business_intelligence/datamining.aspx

Recibido: 07/11/11

26

emplear en Business Intelligence, ya que proveen a los gerentes de un acceso sencillo a informacin interna y externa de su compaa, y que es relevante para sus factores clave de xito. Sistemas expertos basados en inteligencia artificial (SSEE)

Los sistemas expertos, tambin llamados sistemas basados en conocimiento, utilizan redes neuronales para simular el conocimiento de un experto y utilizarlo de forma efectiva para resolver un problema concreto. Este concepto est muy relacionado con el datamining.

Sistemas de apoyo a decisiones de grupo (GDSS)

Un

sistema

de

apoyo

decisiones es "un

en

grupos

(GDSS, en

GroupDecisionSupportSystems)

sistema

basado

computadoras que apoya a grupos de personas que tienen una tarea (u objetivo) comn, y que sirve como interfaz con un entorno compartido". El supuesto en que se basa el GDSS es que si se mejoran las comunicaciones se pueden mejorar las decisiones.13

2.5 EL DESCUBRIMIENTO DE CONOCIMIENTOS EN BASES DE DATOS14

Para llegar a conocer los patrones existentes dentro de las bases de datos se debe resolver un problema de asociacion. Este tipo de problema se caracteriza por buscar patrones dentro de los datos para llegar a reglas que asocien los diferentes atributos de ellas. Para resolver el problema de interes se analizara la informacion contenida en la base de datos en forma de transacciones, donde una transaccion contiene los datos de los articulos comprados por un mismo cliente. Este problema se conoce como problema del carrito del supermercado. Su proposito es estudiar los articulos adquiridos por un
13

http://www.sinnexus.com/business_intelligence/datamining.aspx

Revisado: 07/08/11

27

cliente para identificar combinaciones que tienen afinidad unos con otros, es decir, se trata de identificar la relacion entre dos articulos presentes en la misma transaccion.

Sin embargo, se requerira una gran cantidad de informacion sin ningun orden especifico, ya que los clientes no suelen acomodarse segn lo que compran. El trabajo de analista sera en buscar entre todos estos datos , cuales pueden proveer informacion valiosa a cerca de los habitos de compra de los clientes. Para resolver este problema se utilizara el proceso de descubrimiento del conocimiento de bases de datos y la mineria de datos, los cuales son muy estudiados en la ctualidad debido a su amplia aplicacin en las bases de datos corporativas las cuales tienden a ser de gran tamao.

2.5.1 PROCEDIMIENTO PARA LA BUSQUEDA DE INFORMACION EN BASES DE DATOS El proceso de KDD consiste en varios pasos, a travez de los cuales se crear un modelo para el analisis de la base de datos. Estos pasos son: A. APRENDER EL DOMINIO DE LA APLICACIN: implica el adquirir conocimiento del area de estudio del sistema y la meta a obtener. Se puede descomponer esta tarea en trea areas: APRENDIZAJE DEL TEMA: el analista debe conocer el proceso detrs de la generacion de la informacion para poder formular las preguntas correctas, seleccionar las variables relevantes a cada pregunta, interpretar lois resultados y sugerir el curso de accion despues de concluido el analisis RECOLECCION DE DATOS: El analista debe conocer donde se encuentran los datos correctos, como fueron obtenidos los datos de varias fuentes, como se oueden cambiar estos datos y el grado de confianza de cada fuente. EXPERIENCIA EN ANALISIS DE DATOS: el experto en DM debe tener conocimientos adecuados en el uso de la estadistica. B. CREACION DE LA BASE DE DATOS DE TRABAJO: consiste en elegir un subconjunto de variables, o datos de muestra, de los cuales se obtendra conocimiento. Esto con el fin de eliminar valores redundantes e inconsistencias en los datos de varias fuentes al juntarlos, dentro de una sola base de datos.

28

C. LIMPIEZA Y PRE PROCESAMIENTO DE DATOS. Incluye operaciones basicas sobre los datos, como el filtrado para reducir ruido y decidir que hacer con los datos faltantes otras tareas de pre procesamiento no tan evidentes son: DERIVAR NUEVOS ATRIBUTOS: crear campos explicitos con relaciones entre los atributos conocidos( como relaciones entre ingresos y gastos) pueden hacer el analisis mas sencillo. AGRUPACION: donde hay relaciones uno-a-muchos en la bases de datos, podemos convertir estas relaciones en uno-a-uno y agregar un campo de conteo o suma que contabilice todos los registros de la relacion. D. REDUCCION DE DATOS Y PROYECCION: este paso el analista trata de buscar caracteristicas utiles para representar los datos en funcion de las metas del proyecto y posiblemente tambien reducir las dimensiones de la base de datos. E. ELEGIR LA FUNCION DEL ALGORITMO DE MINERIA DE DATOS: el proposito del modelo se decidira en este paso. Usualmente los algoritmos de DM realizan una de las siguientes tareas: SINTESIS: dados una gran cantida de atributos es necesario sintetizar los datos usando varias reglas caracteristicas que simplificaran la

construccion del modelo. ASOCIACION. Los algoritmos en esta clase generan reglas que asocian patrones de transaccion con cierta probabilidad. AGRUPAMIENTO. Agrupar objetos dentro de clases, basados en sus caracteristicas, maximizando la semejanza dentro de la mismaclase, y minimizando la semejanza entre clases diferentes. CLASIFICACION Y PREDICCION. Categorizar datos basandose en un conjunto de datos de entrenamiento y hacer un modelo para cada clase. Este modelo sirva para clasificar los nuevos datos agregados a la base de datos. F. ELEGIR EL ALGORITMO DE MINERIA DE DATOS. La tarea consiste en seleccionar el metodo a ser usado para la busqueda de patrones en los datos. Esto refina el alcance de la tarea anterior para utilizar el algoritmo mas adecuado que ayude alcanzar el objetivo final. G.MINERIA DE DATOS. Es el paso de analisis propiamente dicho. H. INTERPRETACION. Consiste en entender los resultados del analisis y sus implicaciones y puede llevar a regresar a alguno de los pasos anteriores. Hay

29

tecnicas de visualizacion que puden ser utilis en este paso para facilitar el entendimiento. I. UTILIZACION DEL CONOCIMIENTO OBTENIDO. La aplicacin de los patrones extraidos puede implicar uno de los siguientes objetivos: DESCRIPCION. La meta es simplemente obtener una descripcion del sistema bajo estudio. PREDICCION. Las relaciones obtenidas son usadas para realizar predicciones de situaciones fuera de la base de datos. INTERVENCION. Los resultados pueden conducir a una intervencion activa en el sistema modelado. El proceso puede contener varias iteraciones o ciclos entre pasos. El punto crucial de este procedimiento se encuentra en el algoritmo de analisis, que provee de una forma inteligente y automatica de obtener conocimiento util a partir de los datos. El paso central de KDD, la mineria de datos, es un metodo de analisis apropiado cuando partimos de una pregunta vaga con muchas relaciones posibles por evaluar, por ejemplo: que grupo de clientes tienden a comparar X? por otro lado si la pregunta es especifica, los metodos estadisticos clasicos resultan mas adecuados para abordar el estudio. En la siguiente sesion se presentan las herramientas que se utilizaran para el analisis de los datos con KDD. En las sesiones restantes se ilustra la aplicacin del proceso KDD al analisis de la base de datos de la organizacinQNETWORK SRL. 2.5.2HERRAMIENTAS DE ANALISIS El descubrimiento de conocimiento se realizo a travez de un programa en lenguaje java. Se eligio este lenguaje debido a que es portatil, es decir, se puede utilizar en cualquier sistema operativo sin cambios en el programa original; esta totalmente orientado a objetos, ademas de tener a disposicion la biblioteca de funciones de analisis Weka. La biblioteca de analisis Weka fue desarrollada por la universidad de Waikato, nueva zelanda, y contiene un conjunto de algoritmos de aprendizaje de maquina. El utilizar esta biblioteca de analisis numerico permite centrarse mas en el manejo de los datos y el formato de los resultados en detalles de implementacion de los algoritmos. Para poder procesar los datos es necesario convertirlo a un archivo especial, llamado ARFF. A continuacion se ilustra por los pasos del KDD mediante el caso de estudio ya mensionado.

30

LA INFORMACION ANALIZAR El primer paso del proceso de KDD es familiarizarse con el dominio de la aplicacin y la meta a obtener. La base de datos de la organizacin contiene informacion a cerca de todos los movimientos realizados por el departamento de ventas durante un periodo de 12 meses los CUALES TOTALIZAN 13 690 MOVIMIENTOS. Cada entrada en esta base de datos representa una compra. La meta del analisis es conocer que articulos compran en comun los clientes, es decir, si un cliente compra un articulo A, es posible que tambien adquiera el articulo C, en la misma compra o compras diferentes. como segundo paso se debe crear la base de datos de trabajo, este proceso puede ser el mas complicado, ya que si no tenemos bien definido el objetivo, cualquier subconjunto de datos puede parecer util. Sin embargo una vez que se sabe cual es el resultado que desea obtener, es posible definir mas facilmente que datos seran necesarios. En caso del estudio que se presentan existen muchos dstos en la base de datos original que no seran utiles para el analisis. Por ejemplo en la GRAFICO 1, la columna con el numero de cliente y su razon social representan la misma informacion, igualmente para el numero de articulo y descripcion. Debido a que se buscan los articulos comunes que compran los clientes, se considerara solamente el numero de cuenta del cliente y el numero de catalogo del articulo. El resto de los datos se descartara. LIMPIEZA Y PRE- PROCESAMIENTO DE DATOS El primer paso para la limpieza ser el eliminar de la base de datos de trabajo productos comprados ms de una vez por el mismo cliente, ya que contiene los movimientos realizados por los clientes durante un periodo de 12 meses, es de esperarse que los clientes hayan comprado un mismo artculo ms de una vez en este periodo. As, si se ordenan los artculos por nmero de cliente y nmero de artculo se pueden identificar grupos de cliente- artculo repetidos, que se pueden eliminar fcilmente. Una vez ordenados los datos hay dos acciones que se deben realizar con ellos. La primera es obtener la lista de todos los artculos diferentes. La segunda la

31

eliminacin de los productos repetidos, con el fin de preparar el archivo ARFF. Ambas tareas se realizaran mediante macros en Excel, debido a que se tienen una cantidad pequea de datos en el caso de trabajo. Una vez obtenida la lista de clientes y artculos se acomodan todos los artculos comprados por un cliente en un rengln. Esta lista contiene los artculos en la primera columna y la lista de artculos por cliente en los renglones a partir de la columna D. A partir de este archivo se obtendr el listado de transacciones para el archivo ARFF. Se desarrolla otro macro ms, que realizara la exportacin desde los datos haciendo lo siguiente: Dentro de la lista de artculos, se marcan con un l los que se encuentran presentes en nuestro arreglo de la derecha y se dejan con el ? los que no se encuentran. Solo se marcan los que tienen ms de un artculo, ya que no se puede obtener una relacin con un solo artculo. Una vez terminado se exporta la columna de valores al archivo ARFF. Esta columna representa una transaccin. Se reinician todas las celdas de valores y se prosigue con la siguiente lnea. Una vez terminado el archivo requerido por nuestro algoritmo, se elige como funcin de minera de datos la de asociacin. EL OBJETIVO DEL ANALISIS Debido a que se espera tener relaciones entre los diferentes productos que se encuentren dentro del conjunto de transacciones de la organizacin, la funcin ms apropiada para el anlisis es el de reglas de asociacin dadas por Web. El descubrimiento de reglas de asociacin busca relaciones o afinidades entre conjuntos de artculos. Un conjunto de artculos se define como cualquier combinacin formada por dos o ms artculos disponibles. Una regla de asociacin se forma con dos conjuntos: la premisa y la conclusin. La conclusin se restringe a un solo elemento. Una regla de asociacin indica una afinidad entre la premisa y la conclusin. Y generalmente est acompaada por estadsticos basados en frecuencia que describen esta relacin.

32

Los estadsticos utilizados inicialmente para describir las relaciones son el soporte y la confianza los cuales son valores numricos. Para describirlos se necesitan algunas definiciones. Se define D como la base de datos de transacciones y N como el nmero de transacciones en D. Cada transaccin D es un conjunto de elementos en el ejemplo un elemento es el nmero de artculo, como: 004l o 3465. Se define sop(X) como la proporcin de transacciones que contienen el conjunto X. donde l es uno de los elementos, y se utilizara /A/ para denotar la cardinalidad del conjunto A.

( )

( )

El soporte de una regla de asociacion es la proporcion de transacciones que contienen tanto a la premisa como la conclusion. La confianza de una regla de asociacion es la proporcion de transacciones que contienen a la premisa y que tambien contienen a la conlusion asi para una asociacion AC ( ( ) ) ( ( ( ) ) ) ( ) ( )

A continuacin se ilustra el clculo del soporte con una pequea base de datos por ejemplo que contiene 10 transacciones. Mostrada en la GRAFICO 3 se puede observar aqu que si se quiere obtener sop (manzanas) de 10 transacciones disponible 4 contienen manzanas por lo que sop (manzanas)= 4/10=0.4 igualmente para el sop(zanahorias) hay 3 transacciones que la contienen, assop (zanahorias)= 3/10= 0.3

Si el soporte o apoyo es suficientemente alto y la base de datos es grande, entonces la confianza es un estimado de la probabilidad de cualquier transaccin futura que contenga la premisa, contendr tambin la conclusin.

El algoritmo de asociacin tratara de descubrir todas las reglas que excedan las cotas mnimas especificada para el soporte y la confianza. La bsqueda exhaustiva de reglas de asociacin considerara simplemente todas las combinaciones posibles de elementos,

33

ponindolas como premisas y conclusiones, entonces se evaluara el soporte y la confianza de cada regla, y se descartara todas las asociaciones que no satisfacen las restricciones. Sin embargo el nmero de combinaciones crece rpidamente con el nmero de elementos, por lo que si hay 1000 elementos se tendrn 21000combinaciones. Para cada premisa existe la posibilidad de formar una regla poniendo como conclusin cualquier conjunto de elementos que no contengan algn elemento que ya se encuentra en la premisa. As, este procedimiento para la bsqueda de reglas de asociacin es muy costoso computacionalmente, por lo que se necesita otro procedimiento ms eficiente. EL ALGORITMO A PRIORI El algoritmo a priori presentado por Agrawal ataca el problema reduciendo el nmero de conjuntos considerados. El usuario define un soporte mnimomin_sop. De la definicin de soporte tenemos que si sop(AUC) min_sop entonces SOP (A-C) min_sop. A priori genera todos los conjuntos que cumplen con la condicin de tener un soporte menor o igual a min_sop. Para conjunto frecuente X se genera todas las reglas de asociacin A-C tales que AUC=X y AC= . Cualquier regla que no satisfaga las restricciones impuestas por el usuario como por ejemplo la confianza mnima, se desechan y las reglas que si cumplen se conservan. Como sop(A) sop (A-C) Y sop (C) sop (A-C), SI AUC es un conjunto frecuente entonces tanto A como C son conjuntos frecuentes. El soporte, la confianza y otras mtricas por las cuales la regla de asociacin A-C es evaluada puede ser derivada desde sop(A), sop(C) Y sop (AUC). As, guardando todos los conjuntos frecuentes y su soporte, tenemos toda la informacin requerida para generar y evaluar las reglas de asociacin que satisfagan min_sop.

En la solucin del problema del carrito del supermercado, cada producto individual aparece solamente en una pequea cantidad del total de las transacciones. As, el nmero de conjuntos frecuentes es relativamente bajo, aun cuando min_sop sea un valor muy pequeo. Por eso, el utilizar conjuntos frecuentes nos permite reducir el espacio de bsqueda a un tamao ms manejable, debido a que los datos del carrito de compras se encuentran muy dispersos.

34

La bsqueda inicial de reglas de asociacin permite encontrar todas las asociaciones que satisfagan una restriccin inicial de soporte y confianza. Esto puede llevar a obtener una gran cantidad de reglas de asociacin a partir de los datos, las cuales no seran manejables. Por lo tanto es deseable reducir el nmero de reglas de tal manera que solo queden las ms interesantes. Para se utilizan otras medidas de inters de las reglas de asociacin como el levantamiento y el apalancamiento. LEVANTAMIENTO Esta medida compara un subconjunto de los datos contra todos los datos, dando resultados ms generalizados que el soporte y la confianza, los cuales solo nos proveen resultados evaluados en un subconjunto de datos. El levantamiento se define como la relacin entre la frecuencia con la conclusin que se encuentra en las transacciones que contienen la premisa, dividida entre la frecuencia de la conclusin de todos los datos. ( ( ) )

Los valores de levantamiento mayor a 1 indican que la conclusin es ms frecuente en las transacciones que contienen tambin la premisa, que en transacciones q no la contienen. Por ejemplo considerando la asociacin

* Y

*
(*

+
+) * (

(*
+

+)

Entonces, * + * + ) ( )

Como contraste consideramos otra asociacin con la misma confianza * + * (* ( + + ) *


( ( )

(* +

+)

35

RESULTADOS OBTENIDOS Una vez programado el algoritmo y listo para ser ejecutado en java, es necesario proveer los parmetros adecuados para obtener una buena cantidad de reglas de asociacin. Los parmetros provistos son: Soporte mnimo = 0.05: es el soporte mnimo a tener para que la regla sea considerada. Este soporte es muy pequeo debido a la relacin entre la cantidad de reglas y la cantidad de atributos que se tienen. Dado que, como ya lo dijimos anteriormente la matriz de transacciones de un problema de un carrito de compras es una matriz dispersa, necesitamos utilizar un valor de confianza muy bajo para obtener reglas desde nuestro archivo. Es por esto que dentro de nuestro algoritmo definimos el soporte mnimo en 0.05 Tipo de mtrica= confianza: las opciones disponibles para esta opcin son los 4 tipos de mtricas explicadas anteriormente: soporte, confianza, levantamiento, apalancamiento. En este caso se indican que se consideraran las reglas con la confianza indicada. Numero de reglas = 20 indica el nmero mximo de reglas a obtener se utiliza como criterio de parada para detener la ejecucin si se llega a este nmero de reglas cumpliendo con las restricciones propuestas.

Una vez obtenidos los resultados, es necesario interpretarlos. Para ello es util conocer las situaciones externas que generaron los datos.

36

Modelo de toma de decisiones Se puede tomar un modelo de toma de decisiones para representar un sistema productivo en trminos matemticos. Un modelo de toma de decisiones se expresa en medida de trminos del desempleo, limitantes y variables de decisin. El propsito de dicho modelo es encontrar los valores ptimos o satisfactorios para las variables de decisin que puedan mejorar el desempeo de los sistemas dentro de las restricciones aplicables. Uno de los primeros usos de este enfoque ocurri en 1915 cuando F.W. Harris desarrollo una frmula para la administracin de inventario basado en la cantidad econmica del pedido. En 1931 Shewhart desarrollo los modelos de decisin cuantitativa para utilizarlo en el trabajo de control estadstico de calidad. En 1947 George Dantzing desarrollo el mtodo simplex para la programacin lineal, con lo cual hizo posible la solucin de una clase completa de modelos matemticos. En la dcada de los 50 el desarrollo de los modelos de simulacin por computadora contribuyo mucho al estudio y al anlisis de operaciones. Y desde 1950 se ha expandido ampliamente el uso de varios modelos de toma de decisiones en las operaciones.

37

DISTRIBUCION DE LA INFORMACION Distribuir la informacin es el proceso que consiste en poner la informacin relevante a disposicin de los interesados de acuerdo al plan establecida. La distribucin eficaz de la informacin incluye, en otras, las siguientes tcnicas: -Modelos emisor-receptor. Ciclos de retroalimentacin y barreras a la comunicacin. - Eleccin del medio. Descripcin precisa de las situaciones en las que es preferible una comunicacin escrita u oral, cuando escribir un memorando informal o informe formal, y cuando comunicarse cara a cara o por correo electrnico. -Estilo de redaccin. Voz pasiva o voz activa, estructura de las oraciones y seleccin de palabras. -Tcnicas de gestin de reuniones. Preparar una agenda y abordar los conflictos. -Tcnicas de presentacin. Lenguaje corporal y diseo de soportes visuales. -Tcnicas de facilitacin. Lograr el consenso y superar los obstculos.

-Plan de direccin. -Informes de desempeo. - Activos de los procesos.

- Mtodos de comunicacin. -Herramientas de distribucin de la informacin.

- Actualizaciones a los activos de los procesos de la organzacin.

Grafico: Distribuir la informacin: Entradas, herramientas y tcnicas, y salidas. Fuente: Gua PMBOK.

38

Grfico: Diagrama de flujo de datos del proceso de distribuir la informacin.

Distribuir la informacin: Entradas

-Plan para la direccin -Informes de desempeo. Los informes de desempeo se utilizan para distribuir la informacin sobre el estado y desempeo. -Activos de los procesos de la organizacin Los activos de los procesos de la organizacin que pueden influir en el proceso distribuir la informacin incluyen, entre otros: Las polticas, procedimientos y directivas relativos a la distribucin de la informacin. Las plantilas. 39

La informacin histrica y la lecciones aprendidas.

DISTRIBUIR LA INFORMACION; Herramientas y Tcnicas

-Mtodos de Comunicacin: Las reuniones individuales y grupales, las video conferencias y las audio conferencias, la mensajera instantnea y otros mtodos de comunicacin remota son usados para distribuir la informacin.

-Herramientas

para la distribucin de informacin: Entre la variedad de

herramientas que pueden utilizarse para distribuir la informacin, se incluyen:

Distribucin de documentos impresos, sistemas manuales de archivo, comunicados de prensa y bases de datos electrnicas de acceso compartido.

Herramientas electrnicas de comunicacin y conferencias, tales como correo electrnico, fax, correo de voz, telfono, videoconferencias y conferencias por internet, sitios web y publicacin en internet;

Herramientas electrnicas para la direccin, interfaces web con software de soporte para las reuniones y oficinas virtuales, portables y herramientas colaborativas de gestin de trabajo.

DISTRIBUCION DE LA INFORMACION: SALIDAS

-Actualizaciones a los activos de los procesos de la organizacin: Entre los activos de los procesos de la organizacin que pueden actualizarse, se incluyen: Notificaciones a los interesados: Informacin que puede suministrarse a los interesados sobre incidentes resueltos, cambios aprobados y estado general de la organizacin. Informes: Formales o informales, incluyen lecciones aprendidas, registro de incidentes y las salidas de otras reas de conocimiento. 40

Registro:

Incluyen

correspondencia,

memorandos,

actas

de

reuniones. Esta informacin debera, en la medida en que sea posible y apropiado, mantenerse de manera organizada. Retroalimentacin a los interesados: La informacin que se recibe de los interesados, se utilizan o distribuyen para mejorar o modificar las tcnicas de trabajo. Documentacin sobre lecciones aprendidas: Documentacin que incluye causas de los incidentes, el razonamiento subyacente a la accin correctiva elegida y otros tipos de lecciones aprendidas sobre la distribucin de la informacin. Las lecciones aprendidas se documentan y distribuyen a fin de que pasen a formar parte de la base de datos histrica de la organizacin.

METODOS DE COMUNICACIN: Las reuniones de revisin del estado pueden utilizarse para intercambiar y analizar informacin acerca del avance y el desempeo. El director emplea normalmente una tcnica de comunicacin de tipo push (empujar), tal como se define a continuacin:

Los mtodos de comunicacin para compartir informacin, pueden clasificarse en:

Comunicacin interactiva: Entre dos o ms partes que realizan un intercambio de informacin de tipo multidireccional. Resulta la manera ms eficiente de asegurar entre todos los participantes una comprensin comn acerca de temas especficos, e incluye reuniones, llamadas telefnicas, videoconferencias, etc.

Comunicacin tipo push (enpujar): Enviada a receptores especficos que necesitan conocer la informacin. Esto segura la distribucin de la informacin, pero no garantiza que efectivamente haya llegado a la audiencia prevista ni que haya sido comprendida. Este tipo de comunicacin incluye las cartas, los

41

memorandos, los informes, los correos electrnicos, los faxes. Los correos de voz, los comunicados de prensa, etc.

Comunicacin tipo Pull(jalar): Utilizada para grandes volmenes de informacin o para audiencias muy grandes, que requieren que los receptores accedan al contenido de la comunicacin segn su propio criterio. Entre los mtodos, se incluyen los sitios intranet, el aprendizaje virtual. Los servidores de contenido, etc.

En funcin de los requisitos de comunicacin, el director del proyecto decide qu mtodos de comunicacin deben utilizarse dentro del proyecto, cmo y cundo hacerlo.
SISTEMAS DE GENERACION DE INFORMES:

Un sistema de generacin de informes suministra herramienta estndar para que el director registre, almacene y distribuya a los interesados informacin relativa a los costos, al avance del cronograma y el desempeo. Los paquetes de software permiten al director consolidar informes prevenientes de varios sistemas y facilitan la distribucin de informes a los interesados. Entre los ejemplos de formatos de distribucin, se encuentran los informes mediante cuadros, el anlisis en hoja de clculo y las presentaciones. Las herramientas grficas pueden utilizarse para crear representaciones visuales de informacin sobre el desempeo.

MODELO DE GESTIN DE INFORMACIN

En el desarrollo del modelo se proponen cinco pilares fundamentales en los que se debe soportar la atencin al usuario, es difcil mantener alineada la informacin al interior de una organizacin, fuera de esta se hace ms difcil.

42

Productos y servicios. Se refiere a la definicin y caractersticas de los productos y servicios que ofrece la organizacin. Esta informacin es un elemento clave para asesorar al usuario y resolver sus dudas. Ms que contar con la informacin, pues toda empresa la tiene o se puede construir fcilmente, es su actualizacin permanente, seguimiento y control. Una parte importante del control, es la gestin de las quejas por diferencia de informacin. Los asesores de servicio, juegan un papel fundamental, dado que son los que se enfrentan con el usuario final, por lo tanto la compresin de la informacin debe ser total; se debe garantizar que el personal nuevo adquiera el conocimiento rpidamente, ayuda la experiencia ganada en la operacin. Procesos. Para garantizar que el flujo de informacin sea el adecuado, que se pueda realizar seguimiento, realizar mejora continua, ajustar a las necesidades del cliente y de la operacin, acortar tiempos de aprendizaje de los asesores nuevos, se debe tener documentado los procesos claves de la operacin, en lo posible se realicen a travs de esquemas, pues ayuda a una mejor compresin. De la organizacin. El conocimiento y la informacin de la organizacin es fundamental. Tenemos que conocer donde trabajamos, sus lineamientos, polticas, cultura organizacional y directrices. Esto da un mayor empoderamiento para resolver las inquietudes de los usuarios en el momento que no se tenga una respuesta especfica al usuario.

Sistemas de informacin. Para garantizar el buen manejo de los aplicativos, una atencin gil y para asegurar que el personal nuevo adquiera las habilidades ms rpido, es necesario contar con la documentacin de los manuales de los sistemas de informacin que se utilicen en la operacin del servicio. Estos pilares del modelo van rodeados de un ciclo permanente de retroalimentacin de la informacin, que servir para mejorar procesos en todos los sentidos, tanto al interior del centro de contactos como hacia las reas del negocio. En todo proceso de contacto con el cliente, es fundamental contar con su opinin, esta se convierte en una retroalimentacin constante al sistema.

43

La palabra informacin proviene del latn clsico y se cree que era deuso comn (Adam, 1973). El trmino informatioes una sustantivacin delverbo informare, que por ser transitivo encuentra su mayor generalidaden la expresin aliquid informare. Esto ltimo significa literalmente darforma a un objeto y seala hacia el desarrollo de un proceso, es decir, haciala gestin; por lo tanto, en su propia gnesis existe una relacin entreambos trminos. La GI, segn Ponjun (2003), es el proceso mediante el cual seobtienen, despliegan o utilizan recursos bsicos (econmicos, fsicos, humanoso materiales) para manejar informacin dentro y para la sociedada la que sirve. Tiene como elemento bsico la gestin del ciclo de vidade este recurso y se desarrolla en cualquier organizacin. La GI, debidoal impetuoso desarrollo de las TIC, sucede cada vez ms en entornosvirtuales, como portales y plataformas web, y hace uso de herramientasinformticas cada vez ms sofisticadas y, al mismo tiempo, ms amigables y accesibles, por lo que los propios usuarios se convierten a menudoen gestores de informacin. 44

La primeras posturas sobre las ciencias de informacin aparecen enla dcada de los sesenta, pero slo a partir de los aos ochenta, puedehablarse del surgimiento de la gestin de la informacin como disciplinaprctica, la cual replantea el mercado del trabajo del profesional dela informacin y demanda un nuevo tipo de profesional con importantesresponsabilidades en el diseo y el desarrollo de sistemas de informacinen las organizaciones. Guzmn (2005) desbroza el camino sobre las principales posturasrelacionadas con el manejo de la informacin, el artculo que abord las ciencias de la informacincomo disciplina independiente fue Information Storage and Retrieval: Los sistemas de informacin tienen como objetivo satisfacer lasnecesidades de sus usuarios mediante la integracin de los flujos de informacinexistentes en las organizaciones. Las tecnologas, los sistema ylas redes de informacin, juntos, generan una revolucin en las organizaciones,que favorece el acceso rpido a la informacin interna y externa,formal e informal; previenen las duplicaciones; producen el mximo rendimientoen el uso de la informacin existente; y evitan su territorialidad. Andreu, Ricart y Valor (1995) definen un sistema de informacincomo unconjunto integrado de procesos, principalmente formales, desarrollados en un entornousuario-computadora que, sobre un conjunto de datos estructurados (bases de datos)de una organizacin, recopilan, procesan y distribuyen selectivamente la informacinnecesaria para la operatividad habitual de la organizacin y las actividades propias dela direccin de la misma (Muoz Cruz, 2005).
Esta definicin refleja la fuerte influencia del componente tecnolgico para el procesamiento y trabajo con la informacin.

Segn Moreira (1999), la contribucin de las TIC hace factibles los objetivos de la organizacin documental, y da acceso a todos los documentos existentes, con seguridad y un distanciamiento mnimo, de forma organizada, con un manejo fcil, rapidez de uso y para audiencias masivas. As, el objetivo bsico de la gestin de informacin es organizar y poner en uso los recursos de informacin de la organizacin (tanto de origen externo como interno), para permitirle operar, aprender y adaptarse a los cambios del ambiente. Los actores principales en la gestin de informacin son los miembros de las organizaciones tanto como proveedores como usuarios, al mismo tiempo, debido a la facilidad en el uso de herramientas para la captura, el procesamiento y anlisis de informacin, lo que acerca cada vez ms a las lites informticas a los diferentes actores dentro de las organizaciones. Los procesos principales de la gestin de informacin son: la identificacin de las necesidades de informacin; la definicin de la disponibilidad 45

y accesos a las fuentes informativas, su organizacin y almacenamiento; el anlisis y monitoreo continuo a travs de diferentes modelos; el desarrollo de productos y servicios, su distribucin y uso compartido, base de la creacin del conocimiento estructurado para la organizacin y, por tanto, fundamento de la gestin del conocimiento (Moreira, Mndez y Rodrguez, 1999).

CAPTULO III
DISEO DE CONTRASTACIN DE HIPTESIS

3.1 Tipo de investigacin Segn la intervencin del investigador: observacional Segn la planificacin de la toma de datos: Retrospectivo Segn el nmero de ocasiones en que se mide la variable de estudio: transversal. Segn el nmero de variables de inters: descriptivo 3.2 Diseo de la investigacin Esta investigacin se considera dentro de un diseo no experimental, puesto que el problema se abordar a travs de la observacin y no se manipular ninguna variable. De la misma manera este estudio tiene la caracterstica de un diseo transversal, porque se desarrollar en base a datos obtenidos en un perodo de tiempo determinado. El tipo de investigacin que se utilizar en el presente trabajo ser el descriptivo, puesto que se buscar especificar las caractersticas y relaciones de la realidad problemtica de la organizacin, lo cual nos permitir tener una visin amplia del problema general que se viene presentando. 3.3 Poblacin y muestra Autoridad Administrativa del Agua VI Maran.

46

3.4Tcnicas e instrumentos de recoleccin de datos Observacin Encuesta

ENCUESTA Buenos das (tardes) estoy trabajando en un estudio que servir para elaborar una tesina acerca de Gestin de la informacin. Quisiera pedir su ayuda para que conteste algunas preguntas que no llevarn mucho tiempo. Le pedimos que conteste con la mayor sinceridad posible.

1.- Cree que acceder a la informacin necesaria para realizar su trabajo es: Fcil Complicado Muy lento

Otra descripcin: .. 2.-Los documentos consultados tienen la informacin:(Marque las caractersticas que usted percibe). a. Organizada por secciones. b. Se encuentra codificada c. Especifica fecha de actualizacin. d. Est en versin digital de fcil acceso. e. Se pueden compartir gilmente.

Si su cargo se relaciona, con brindar informacin al usuario, conteste. Sino pase a la pregunta N 4. 3. El manejo de informacin en su institucin, le facilita a usted organizar mejor la informacin que debe transmitir al usuario? comprender u

47

No

4.- Cundo obtiene informacin para realizar su trabajo, usted toma las acciones: Archiva Codifica Registra Deriva a otras reas Utiliza la informacin para realizar informes u otro documento.

5.- Sabe de la existencia de alguna herramienta para gestionar su informacin de manera efectiva? No S Cul? ..

6.- Cree que gestionar la informacin requiere de una fuerte inversin para su organizacin?

No

No sabe/ No opina

7.- Considera usted que debera implementarse una mejora en el manejo de informacin ensuorganizacin? No S Cul?.................................................................................................................................... ...................................................................................................................................

Muchas gracias por tu colaboracin.

48

3.5 Procesamiento y anlisis de datos

1.- Cree que acceder a la informacin necesaria para realizar su trabajo es: fcil complicado muy lento TOTAL 6 9 2 18

Interpretacin: Del total de 18 trabajadores de la Autoridad Nacional del Agua encuestados el 53% encuentra complicado acceder a la informacin. Mientras que el 35% de los encuestados opinan que es fcil acceder a la informacin. 2.-Los documentos consultados tienen la informacin:(Marque las caractersticas que usted percibe). Organizar por secciones Se encuentra codificada Especfica fecha de actualizacin Est en versin digital de fcil acceso Se puede compartir gilmente TOTAL DE RESPUESTAS 7 5 5 6 2 25 49

Organizar por secciones Especfica fecha de actualizacin Se puede compartir gilmente

Se encuentra codificada Est en versin digital de facil acceso

8% 28% 24%

20%

20%

Interpretacin: Del total de 18 trabajadores de la Autoridad Nacional del Agua encuestados el 28% organiza por secciones la informacin, mientras que solo el 8% opina que la informacin se puede compartir gilmente.

3. El manejo de informacin en su institucin, le facilita a usted comprender u organizar mejor la informacin que debe transmitir al usuario?

Si No TOTAL DE RESPUESTAS 4 5
Si 7% No

14 1 15

93%

50

Interpretacin: Del total de 18 trabajadores de la Autoridad Nacional del Agua encuestados el 93% opina que el manejo de informacin en su institucin le facilita comprender u organizar mejor la informacin que debe transmitir al usuario.

4.- Cundo obtiene informacin para realizar su trabajo, usted toma las acciones: Archiva Codifica Registra Deriva a otras reas Utiliza la informacin para realizar informes u otro documento. TOTAL DE RESPUESTAS 7 6 8 0 9 30

Interpretacin: Los encuestados indicaron que en la Autoridad Nacional del Agua la informacin es archivada por el 23%, el 20% la codifica, el 27% la registra, mientras que el 30%utiliza la informacin para realizar informes.
Archiva Codifica Registra Deriva a otras reas Utiliza la informacin para realizar informes u otro documento.

30%

23%

0% 27%

20%

51

5.- Sabe de la existencia de alguna herramienta para gestionar su informacin de manera efectiva?

Si No TOTAL Cul?

9 9 18 Internet base de datos geoespaciales HUMMINGBIRD SOFTWARE CLOUD COMPUTER

EXCEL SIG-BSC ARGIS ERP

Interpretacin: Del total de 18 trabajadores de la Autoridad Nacional del Agua encuestados el 50% conoce herramientas de gestin de informacin.
Si No

50%

50%

6.- Cree que gestionar la informacin requiere de una fuerte inversin para su organizacin?

Si No No sabe /no opina TOTAL

7 8 3 18

52

Si

No

No sabe /no opina

17% 39%

44%

Interpretacin: Del total de 18 trabajadores de la Autoridad Nacional del Agua encuestados el 44% opina que gestionar la informacin requiere de una fuerte informacin, mientras que el 17% no sabe/no opina. 7.- Considera usted que debera implementarse una mejora en el manejo de informacin en su organizacin? Si No TOTAL 16 2 18

aula virtual por reas sistema de gestin de documentos sistema de evaluacin por resultados sistema de mejora continua ERP Y CMR Formatos digitales Organizar y codificar Definir los flujos de la informacin Formatos estandndares

Interpretacin: Del total de 18 trabajadores de la Autoridad Nacional del Agua encuestados el 89% opina que debera implementarse una mejora en el manejo de informacin.

53

Si

No

11%

89%

CAPTULO IV DESARROLLO DE UNA ESTRATEGIA CORPORATIVA CON SOPORTE EN GESTIN DE LA INFORMACIN


Minera de datos aplicada, a la organizacin Autoridad Administrativa del Agua VI Maran

El primer paso para que usted pueda aplicar sistemas inteligentes en su organizacin es determinar Qu es lo que desea obtener de este tipo de anlisis? GRAFICO 27:Conjunto de datos sobre las caractersticas del servicio.

Tipo de Producto

Lugar donde lo solicita

Medios de comunicacin

Motivo

Servicio

Dentro del establecimiento

Por internet

Atencin del usuario

informacin

Por volantes

Relaciones Pblicas

54

Elaboracin Propia.

55

Teniendo en cuenta que en la Autoridad Administrativa del Agua VI Maran, no es necesario adquirir una herramienta costosa de minera de datos si lo que buscamos es anlisis de reglas de asociacin, existen diversidad de herramientas de minera de datos para el tipo de anlisis y analticos avanzados La herramienta que usaremos se llama WEKA es un software de minera de datos desarrollado en la Universidad de Waikato. WEKA contiene una amplia coleccin de algoritmos de aprendizaje para emplearse en anlisis de minera de datos, y contiene dentro de otros, una buena gama de algoritmos de asociacin.

Basta una bsqueda en la WEB para ubicar la pgina de la Universidad de Waikato y descargar WEKA, una vez instalado el software, el siguiente paso ser proporcionar el archivo que contiene los datos a analizar. Un ejemplo en la siguiente tabla. GRAFICO 28: Base de datos organizacin Autoridad Administrativa del Agua VI Maran

56

WEKA es una herramienta muy intuitiva y fcil de usar: a. Introduccin de datos de nuestro inters: Una vez instalado el programa proporcionaremos el archivo que contienen datos a analizar. En este caso introduciremos la base de datos de la encuesta aplicada a los clientes de la organizacin Autoridad Administrativa del Agua VI Maran, una vez proporcionado el archivo, obtendremos:

GRAFICO 29: Introduccin de datos en el programa WEKA.

b. Interpretacin de la informacin: En la pantalla del GRAFICO anterior podemos observar: En el lado izquierdo, en forma numerada, el conjunto de atributos o campos que estamos proporcionando en nuestro archivo. Un conteo de elementos pertenecientes a cada atributo Un grfico de visualizacin de los datos que nos permite rpidamente encontrar dependencias a simple vista.

57

Este grafico de visualizacin de datos nos da una asociacin o dependencia entre los datos que se encuentran en la tabla y la clase o atributo que se selecciona.

c.Generacin de reglas de asociacin:

Para seleccionar un anlisis avanzado de tipo de asociacin de datos la opcin correspondiente es Associate, que se encuentra en las pestaas en la parte superior de la pantalla (ver fig. anterior). La pantalla que se abrir ser la muestra en la siguiente GRAFICO, bajo el botn Choose se encuentran los algoritmos o tcnicas que posee WEKA para el tipo de anlisis de asociacin. El botn Start iniciar el anlisis. GRAFICO 30: Generacin de reglas de asociacin en el programa WEKA.

58

INTERPRETANDO RESULTADOS:

El anlisis se ejecuta en unos cuantos segundos. WEKA con los parmetros por default que emplea se asegura que el grado de confianza de las reglas sea adecuado, independientemente de algoritmo seleccionado. Al igual que se realizar para cada algoritmo, el nmero de iteraciones necesarias para alcanzar el grado de confianza adecuado, as que no tenemos en este momento que preocuparnos por conocer todos los parmetros de los algoritmos y podemos manejar los defaults de WEKA.

GRAFICO 31: Visualizacin de reglas de asociacin.

59

CONCLUSIONES

Debemos tener en cuenta que la implementacin de Gestin de la informacin abarca tener un personal especializado y un presupuesto que permita

desembolsar recursos. Precisamente por ello al desarrollar este estudio se logr el uso de herramienta de manera costeable, factible y funcional que otorgue soluciones reales.

La incursin de la tecnologa analtica en la operacin y seguimiento de procesos en la organizacin Autoridad Administrativa del Agua VI Maran, marca un gran punto de diferenciacin para crecer en un mercado tan competitivo.

La minera de datos otorga la capacidad de identificar patrones, comportamientos, reglas, relaciones en lo datos.

La Gestin de la informacin pretende transformar los datos en conocimiento, para que este pueda ser usado oportunamente en la toma de decisiones, propiciando acciones que resulten en una ventaja competitiva para Autoridad Administrativa del Agua VI Maran.

Entre las capacidades de la minera de datos esta el descubrimiento de datos que aporten valor a los procesos de negocio, identificndose en la organizacin Autoridad Administrativa del Agua VI Maran en el proceso de toma de decisiones.

En el anlisis por medio de reglas de asociacin, consideramos como uno de los factores de xito ms importante a la preparacin de datos, seguido de determinar el objetivo del anlisis.

Este proceso adems de ayudar a crear polticas y estndares de calidad en sus datos as como mecanismos de control.

60

Los sistemas de gestin de la informacin, pueden lidiar con la incertidumbre y la imprecisin de la informacin, permitiendo librar obstculos como datos incompletos, ruido en la informacin, permitiendo librar obstculos como ruidos en la informacin, ambigedad e informacin no estructurada entre otros.

La informacin es un proceso en el cual participan el informador y el informado. Para mejorar los flujos de informacin es necesario entender mejor los comportamientos informacionales de las personas: sus modelos mentales y procesos cognitivos.

La informacin se transmite mejor si est altamente estructurada y formalizada.

El valor de la informacin lo da exclusivamente el usuario.

La informacin resulta intil si las personas no estn motivadas para usarla.

RECOMENDACIONES El uso de herramientas de uso libre en donde se puede obtener informacin valiosa para la organizacin Autoridad Administrativa del Agua VI Maran. El anlisis de minera de datos se hizo a travs del uso de reglas de asociacin, utilizando herramientas libres de anlisis avanzados como WEKA, para ello es indispensable que sepa qu tipo de anlisis requiere y que tipo de resultados arroja. Ninguna solucin de gestin de la informacin es igual a otra, por lo que algunas resultan mucho ms simple de llevar a cabo que otras.

61

BIBLIOGRAFIA

Garca Vega, Anglica.La inteligencia artificial en los negocios. Universidad de Veracruz, 2002 Larissa T. Moss y ShakuAtre. Business Intelligence Roadmap. Editorial Pearson Rducation.Inc,2003 Laudon, Kenneth C. Administracin de los sistemas de informacin, organizacin y tecnologa.Editorial Pearson Education, 2004 Carlos A. Benavides Velasco y Cristina Quintana Garca. Gestin del conocimiento y calidad total, Ediciones Daz de Santos,2003 Miguel ngel Aguirre. "La Direccin revolucionaria.EditorialVisin net, 2003 Martnez Snchez, Juan M. Jimnez, Emilio. Marketing.Editorial Norma,2010 Quijano Ponce de Len, Andrs. Sistema de produccin.Editorial: El Cid Editor, 2009 Franklin Ros Ramos.Direccin De Operaciones De Servicios. 2006 Arias Aranda. La estrategia de operaciones en las organizacins de servicio. (2001). Rivera Y Huete. Utilidad de la cadena de valor.EditorialthePhilippinerattan sector, 2004. M. Weis, NitinIndurkhya, Tong Zhang, Fred J. Damerau.Text Mining: Mtodos de prediccin para analizar la informacin no estructurada.Editorial Springer,2005.

D. A. D Skyrme, Creating the Knowledge-based Business.Editorial Business Intelligence Ltd, 1997. Ian H. Witten, Eibe Frank. Data Mining: Practical Machine Learning Tools andTechniques.Editorial Data Mining Book, 2005. SushmitaMitra. Data Mining in Soft Computing Framework: A Survey. Pabitra Mitra, 2002. J. Froelich, S. Ananyan and D. L. Olson.Decision support via text mining. 2005.

62

También podría gustarte