Está en la página 1de 16

Introduccin

En este trabajo se hablara sobre los temas de: Sistema Servidor-Cliente, Almacn de Datos y Minera de Datos, los cuales se han investigado y se intentara explicar y detallar de la mejor manera posible adems de mostrar aplicaciones reales de los mismos. A continuacin conoceremos un poco de cada tema para introducirnos al marco terico. La arquitectura cliente-servidor es un modelo de aplicacin distribuida en el que las tareas se reparten entre los proveedores de recursos o servicios, llamados servidores, y los demandantes, llamados clientes Almacn de datos o data warehouse es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.), integrado, no voltil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. La minera de datos es un campo de las ciencias de la computacin referido al proceso que intenta descubrir patrones en grandes volmenes de conjuntos de datos. Los cuales se explicaran ms detalladamente en el marco terico del presente trabajo.

Resumen
Arquitectura Servidor-Cliente: En esta arquitectura la capacidad de proceso est repartida entre los clientes y los servidores, aunque son ms importantes las ventajas de tipo organizativo debidas a la centralizacin de la gestin de la informacin y la separacin de responsabilidades, lo que facilita y clarifica el diseo del sistema. La separacin entre cliente y servidor es una separacin de tipo lgico, donde el servidor no se ejecuta necesariamente sobre una sola mquina ni es necesariamente un slo programa. Los tipos especficos de servidores incluyen los servidores web, los servidores de archivo, los servidores del correo, etc. Mientras que sus propsitos varan de unos servicios a otros, la arquitectura bsica seguir siendo la misma. La arquitectura cliente/servidor genrica tiene dos tipos de nodos en la red: clientes y servidores. Consecuentemente, estas arquitecturas genricas se refieren a veces como arquitecturas de dos niveles o dos capas. Algunas redes disponen de tres tipos de nodos:

Clientes que interactan con los usuarios finales. Servidores de aplicacin que procesan los datos para los clientes. Servidores de la base de datos que almacenan los datos para los servidores de aplicacin.

Almacn de datos lo que se quiere es contener datos que son necesarios o tiles para una organizacin, es decir, que se utiliza como un repositorio de datos para posteriormente transformarlos en informacin til para el usuario. Un almacn de datos debe entregar la informacin correcta a la gente indicada en el momento ptimo y en el formato adecuado. El almacn de datos da respuesta a las necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones (DSS), Sistemas de informacin

ejecutiva (EIS) o herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fcilmente consultas sobre sus almacenes de datos sin tocar o afectar la operacin del sistema. La tarea de minera de datos es el anlisis automtico o semi-automtico de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (anlisis cluster), registros poco usuales (la deteccin de anomalas) y dependencias (Asociacin Minera regla). Esto generalmente implica el uso de tcnicas de bases de datos como los ndices espaciales. Estos patrones pueden entonces ser visto como una especie de resumen de los datos de entrada, y puede ser utilizado en el anlisis adicional o, por ejemplo, en la mquina de aprendizaje y anlisis predictivo. Por ejemplo, el paso de minera de datos podran identificar varios grupos en los datos, que luego pueden ser utilizados para obtener resultados ms precisos de prediccin por un sistema de soporte de decisiones. Ni la recoleccin de datos, preparacin de datos, ni la interpretacin de los resultados y la informacin son parte de la etapa de minera de datos, pero que pertenecen a todo el proceso KDD como pasos adicionales.

Marco Terico Sistema Cliente-Servidor La arquitectura Cliente/Servidor agrupa conjuntos de elementos que efectan procesos distribuidos y computo cooperativo. La arquitectura cliente/servidor es un modelo para el desarrollo de sistemas de informacin, en el que las transacciones se dividen en procesos independientes que cooperan entre s para intercambiar informacin, servicios o recursos. Se denomina cliente al proceso que inicia el dilogo o solicita los recursos y servidor, al proceso que responde a las solicitudes. Es el modelo de interaccin ms comn entre aplicaciones en una red. Beneficios: * Mejor aprovechamiento de la potencia de cmputo (Reparte el trabajo). * Reduce el trfico en la Red. (Viajan requerimientos). * Opera bajo sistemas abiertos. * Permite el uso de interfaces grficas variadas y verstiles. Qu es el Cliente? Conjunto de Software y Hardware que invoca los servicios de uno o varios servidores. Los Clientes interactan con el usuario, usualmente en forma grfica. Frecuentemente se comunican con procesos auxiliares que se encargan de establecer conexin con el servidor, enviar el pedido, recibir la respuesta, manejar las fallas y realizar actividades de sincronizacin y de seguridad. Caractersticas: El Cliente oculta al Servidor y la Red. Detecta e redireccionarlas. intercepta peticiones de otras aplicaciones y puede

Dedicado a la cesin del usuario ( IniciaTermina ). El mtodo ms comn por el que se solicitan los servicios es a travs de RPC (Remote Procedure Calls). Funciones Comunes del Cliente: Mantener y procesar todo el dialogo con el usuario. Manejo de pantallas. Mens e interpretacin de comandos. Entrada de datos y validacin. Procesamiento de ayudas. Recuperacin de errores. Generacin de consultas e informes sobre las bases de datos.

Qu es el Servidor? Conjunto de Hardware y Software que responde a los requerimientos de un cliente. Los Servidores proporcionan un servicio al cliente y devuelven los resultados. En algunos casos existen procesos auxiliares que se encargan de recibir las solicitudes del cliente, verificar la proteccin, activar un proceso servidor para satisfacer el pedido, recibir su respuesta y enviarla al cliente. Adems, deben manejar los interbloqueos, la recuperacin ante fallas, y otros aspectos afines. Por las razones anteriores, la plataforma computacional asociada con los servidores es ms poderosa que la de los clientes. Por esta razn se utilizan PCs poderosas, estaciones de trabajo, minicomputadores o sistemas grandes. Adems deben manejar servicios como administracin de la red, mensajes, control y administracin de la entrada al sistema (login), auditora y recuperacin y contabilidad. Tipos Comunes de Servidores: Servidor de Archivos (FTP, Novell). Servidor de Bases de Datos (SQL, CBASE, ORACLE, INFORMIX). Servidor de Comunicaciones Servidor de Impresin. Servidor de Terminal. Servidor de Aplicaciones (Windows NT, Novell). Funciones Comunes del Servidor: Acceso, almacenamiento y organizacin de datos. Actualizacin de datos almacenados. Administracin de recursos compartidos. Ejecucin de toda la lgica para procesar una transaccin. Procesamiento comn de elementos del servidor (Datos, capacidad de CPU, almacenamiento en disco, capacidad de impresin, manejo de memoria y comunicacin). Gestin de perifricos compartidos. Control de accesos concurrentes a bases de datos compartidas. Enlaces de comunicaciones con otras redes de rea local o extensa Para que los clientes y los servidores puedan comunicarse se requiere una infraestructura de comunicaciones, la cual proporciona los mecanismos bsicos de direccionamiento y transporte. La mayora de los sistemas Cliente/Servidor actuales, se basan en redes locales y por lo tanto utilizan protocolos no orientados a conexin, lo cual implica que las aplicaciones deben hacer las verificaciones. Red de comunicacin.- Es todo aquel conjunto de elementos basados en hardware y software que permite establecer un enlace entre los clientes y los servidores, se clasifican por su tamao LAN, MAN y WAN. La red debe tener

caractersticas adecuadas de desempeo, confiabilidad, transparencia y administracin. Caractersticas Funcionales de la arquitectura cliente servidor Esta arquitectura se puede clasificar en cinco niveles, segn las funciones que asumen el cliente y el servidor, tal y como se puede ver en el siguiente diagrama: En el primer nivel el cliente asume parte de las funciones de presentacin de la aplicacin, ya que siguen existiendo programas en el servidor, dedicados a esta tarea. Dicha distribucin se realiza mediante el uso de productos para el maquillaje de las pantallas del mainframe. Esta tcnica no exige el cambio en las aplicaciones orientadas a terminales, pero dificulta su mantenimiento. Adems, el servidor ejecuta todos los procesos y almacena la totalidad de los datos. En este caso se dice que hay una presentacin distribuida o embellecimiento. En el segundo nivel, la aplicacin est soportada directamente por el servidor, excepto la presentacin que es totalmente remota y reside en el cliente. Los terminales del cliente soportan la captura de datos, incluyendo una validacin parcial de los mismos y una presentacin de las consultas. En este caso se dice que hay una presentacin remota. En el tercer nivel, la lgica de los procesos se divide entre los distintos componentes del cliente y del servidor. El diseador de la aplicacin debe definir los servicios y las interfaces del sistema de informacin, de forma que los papeles de cliente y servidor sean intercambiables, excepto en el control de los datos, que es responsabilidad exclusiva del servidor. En este tipo de situaciones se dice que hay un proceso distribuido o cooperativo. En el cuarto nivel el cliente realiza tanto las funciones de presentacin como los procesos. Por su parte, el servidor almacena y gestiona los datos que permanecen en una base de datos centralizada. En esta situacin se dice que hay una gestin de datos remota. En el quinto y ltimo nivel, el reparto de tareas es como en el anterior y adems el gestor de base de datos divide sus componentes entre el cliente y el servidor. Las interfaces entre ambos, estn dentro de las funciones del gestor de datos y, por lo tanto, no tienen impacto en el desarrollo de las aplicaciones. En este nivel se da lo que se conoce como bases de datos distribuidas. Caractersticas fsicas de la arquitectura cliente servidor El diagrama del punto anterior da una idea de la estructura fsica de conexin entre las distintas partes que componen una arquitectura cliente / servidor. La idea principal consiste en aprovechar la potencia de los ordenadores personales para realizar, sobre todo, los servicios de presentacin y, segn el nivel, algunos procesos o incluso algn acceso a datos locales. De esta forma se descarga al servidor de ciertas tareas para que pueda realizar otras ms rpidamente. Tambin existe una plataforma de servidores que sustituye al ordenador central tradicional y que da servicio a los clientes autorizados. Incluso a veces el antiguo ordenador central se integra en dicha plataforma como un servidor ms. Estos

servidores suelen estar especializados por funciones (seguridad, clculo, bases de datos, comunicaciones, etc.), aunque, dependiendo de las dimensiones de la instalacin se pueden reunir en un servidor una o varias de estas funciones. Para la comunicacin de todos estos elementos se emplea un sistema de red que se encarga de transmitir la informacin entre clientes y servidores. Fsicamente consiste en un cableado (coaxial, par trenzado, fibra ptica, etc.) o en conexiones mediante seales de radio o infrarrojas, dependiendo de que la red sea local (LAN o RAL), metropolitana (MAN) o de rea extensa (WAN). Para la comunicacin de los procesos con la red se emplea un tipo de equipo lgico denominado middleware que controla las conversaciones. Su funcin es independizar ambos procesos (cliente y servidor). La interface que presenta es la estndar de los servicios de red, hace que los procesos piensen en todo momento que se estn comunicando con una red. Caractersticas Lgicas de la arquitectura cliente servidor Una de las principales aportaciones de esta arquitectura a los sistemas de informacin, es la interfaz grfica de usuario. Gracias a ella se dispone de un manejo ms fcil e intuitivo de las aplicaciones mediante el uso de un dispositivo tipo ratn. En esta arquitectura los datos se presentan, editan y validan en la parte de la aplicacin cliente. En cuanto a los datos, cabe sealar que en la arquitectura cliente / servidor se evitan las duplicidades (copias y comparaciones de datos), teniendo siempre una imagen nica y correcta de los mismos, disponible en lnea para su uso inmediato. Todo esto tiene como fin que el usuario de un sistema de informacin soportado por una arquitectura cliente / servidor, trabaje desde su estacin de trabajo con distintos datos y aplicaciones, sin importarle dnde estn o dnde se ejecuta cada uno de ellos.

Minera de Datos Las tcnicas de Minera de Datos son el resultado de un largo proceso de investigacin y desarrollo de productos. Esta evolucin comenz cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continu con mejoras en el acceso a los datos, y ms recientemente con tecnologas generadas para permitir a los usuarios navegar a travs de los datos en tiempo real. La Minera de Datos toma este proceso de evolucin ms all del acceso y navegacin retrospectiva de los datos, hacia la entrega de informacin prospectiva y proactiva. La Minera de Datos est lista para su aplicacin en la comunidad de negocios porque est soportado por tres tecnologas que ya estn suficientemente maduras: Recoleccin masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Minera de Datos

Los algoritmos de la Minera de Datos utilizan tcnicas que han existido por lo menos desde hace 10 aos, pero que slo han sido implementadas recientemente como herramientas maduras, confiables. En la evolucin desde los datos de negocios a informacin de negocios, cada nuevo paso se basa en el previo. Por ejemplo, el acceso a datos dinmicos es crtico para las aplicaciones de navegacin de datos, y la habilidad para almacenar grandes bases de datos es crtica para la Minera de Datos. Los componentes esenciales de la tecnologa de la Minera de Datos han estado bajo desarrollo por dcadas, en reas de investigacin como estadsticas, inteligencia artificial y aprendizaje de mquinas. Hoy, la madurez de estas tcnicas, junto con los motores de bases de datos relacionales de alta performance, hicieron que estas tecnologas fueran prcticas para los entornos de datawarehouse actuales. Principales caractersticas y objetivos de la Minera de Datos Explorar los datos se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen informacin almacenada durante varios aos. En algunos casos, los datos se consolidan en un almacn de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. Las herramientas de la minera de datos ayudan a extraer el mineral de la informacin enterrado en archivos corporativos o en registros pblicos, archivados. El minero es, muchas veces un usuario final con poca o ninguna habilidad de programacin, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas y obtener rpidamente respuestas. Las herramientas de la minera de datos se combinan fcilmente y pueden analizarse y procesarse rpidamente. Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minera de datos. La minera de datos produce cinco tipos de informacin: Asociaciones. Secuencias. Clasificaciones. Agrupamientos. Pronsticos.

En la minera de datos, se coleccionan los datos y se espera que de ellos emerjan hiptesis. Se busca que los datos describan o indiquen por qu son como son. Luego entonces, se valida esa hiptesis inspirada por los datos en los datos mismos, ser numricamente significativa, pero experimentalmente invlida. De ah que la minera de datos debe presentar un enfoque exploratorio, y no confirmador. Usar la minera de datos para confirmar las hiptesis formuladas puede ser peligroso, pues se est haciendo una inferencia poco vlida. La minera de datos es una tecnologa compuesta por etapas que integra varias reas y que no se debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan diferentes aplicaciones software en cada etapa que pueden ser estadsticas, de visualizacin de datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o herramientas comerciales de minera de datos muy poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con otra herramienta.

Aplicaciones
Sistema Cliente-Servidor
Las aplicaciones cliente-Servidor nos permiten realizar muchos y diferentes tipos de tareas de manera remota, es decir, ofrecen la posibilidad de trabajar desde un terminal con comodidad y sin complicaciones. Una aplicacin Cliente-Servidor es un programa que cuenta con un frontend que establece una conexin directa a travs de una red, con un servidor que aloja el programa o desarrollo informtico al cual deseemos acceder.

Una vez establecida la conexin, el mismo cliente (software que se ejecuta del lado del usuario), despliega una interfaz de trabajo que permite al usuario realizar la tarea de manera cmoda y eficiente. Desarrollos Web Caso particular de desarrollo cliente servidor con

representacin remota, en la cual disponemos de un protocolo standard: HTTP y un middleware denominado WebServer. Cada pgina puede desencadenar la solicitud de

numerosos peticiones adicionales para finalizar el proceso de representacin remota.

Se dispone de un lenguaje standard de definicin y formateo de pginas: HTML

Minera de Datos
En la Empresa Deteccin de fraudes en las tarjetas de crdito. En 2001, las instituciones financieras a escala mundial perdieron ms de 2.000 millones de dlares estadounidenses en fraudes con tarjetas de crdito y dbito. El Falcon Fraud Manager es un sistema inteligente que examina transacciones, propietarios de tarjetas y datos financieros para detectar y mitigar fraudes. En un principio estaba pensado, en instituciones financieras de Norteamrica, para detectar fraudes en tarjetas de crdito. Sin embargo, actualmente se le han incorporado funcionalidades de anlisis en las tarjetas comerciales, de combustibles y de dbito. El sistema Falcon ha permitido ahorrar ms de seiscientos millones de dlares estadounidenses cada ao y protege aproximadamente ms de cuatrocientos cincuenta millones de pagos con tarjeta en todo el mundo, aproximadamente el sesenta y cinco por ciento de todas las transacciones con tarjeta de crdito.

En los Clubes Deportivos


Los equipos de la NBA utilizan aplicaciones inteligentes para apoyar a su cuerpo de entrenadores. El Advanced Scout es un software que emplea tcnicas de data mining y que han desarrollado investigadores de IBM para detectar patrones estadsticos y eventos raros. Tiene una interfaz grfica muy amigable orientada a un objetivo muy especfico: analizar el juego de los equipos de la National Basketball Association (NBA). El software utiliza todos los registros guardados de cada evento en cada juego: pases, encestes, rebotes y doble marcaje a un jugador por el equipo contrario, entre otros. El objetivo es ayudar a los entrenadores a aislar eventos que no detectan cuando observan el juego en vivo o en pelcula. Un resultado interesante fue uno hasta entonces no observado por los entrenadores de los Knicks de Nueva York. El doble marcaje a un jugador puede generalmente dar la oportunidad a otro jugador de encestar ms fcilmente. Sin embargo, cuando los Bulls de Chicago jugaban contra los Knicks, se encontr que el porcentaje de encestes despus de que al centro de los Knicks, Patrick Ewing, le hicieran doble marcaje era extremadamente bajo, indicando que los Knicks no reaccionaban correctamente a los dobles marcajes. Para saber el porqu, el cuerpo de entrenadores estudi cuidadosamente todas las pelculas de juegos contra Chicago. Observaron que los jugadores de Chicago rompan su doble marcaje muy rpido de tal forma que podan tapar al encestador libre de

los Knicks antes de prepararse para efectuar su tiro. Con este conocimiento, los entrenadores crearon estrategias alternativas para tratar con el doble marcaje. La temporada pasada, IBM ofreci el Advanced Scout a la NBA, que se convirti as en un patrocinador corporativo. La NBA dio a sus veintinueve equipos la oportunidad de aplicarlo. Dieciocho equipos lo estn haciendo hasta el momento obteniendo descubrimientos interesantes.

APLICACIONES ALMACEN DE DATOS Aspectos a tener en cuenta: Cuestiones operacionales signicativas en los almacenes construccin, la administracin y el control de calidad. de datos: la

La gestin del proyecto (diseo, construccin e implementacin del almacn de datos)supone un reto. La construccin de un almacn de datos empresarial en una gran organizacin es una tarea de gran importancia. Potencialmente supone una labor de aos desde su concepcin hasta su implementacin. El desarrollo y utilizacin extendida de data marts pueden proporcionar una alternativa interesante, especialmente para aquellas organizaciones que tienen necesidades urgentes de soporte OLAP, DSS o de minera de datos. La administracin de un almacn de datos es una labor intensa, proporcional al tamao y complejidad del almacn. Una organizacin que intente administrar un almacn de datos debe comprender de forma realista la naturaleza compleja de su administracin. Aunque est diseado para operaciones de lectura, su estructura no es ms esttica de lo que puedan serlo sus fuentes de informacin. Se puede esperar que las bases de datos fuente evolucionen. Tambin debe esperarse que el esquema del almacn de datos y el componente de adquisicin sean actualizados para manejar dicha evolucin. Un aspecto signicativo del almacenamiento de datos es el control de calidad de los datos. Aunque los datos atraviesen un proceso de limpieza durante su obtencin, la calidad y la coherencia siguen siendo aspectos signicativos para el administrador de la base de datos. La combinacin de datos procedentes de fuentes heterogneas y dispares es uno de los retos principales si consideramos las diferencias de denominacin, deniciones de dominios y nmeros de identicacin entre otros.

Cada vez que una base de datos fuente cambia, el administrador del almacn de datos debe considerar las posibles interacciones con otros elementos del almacn. El almacn debe disearse para tener en cuenta la incorporacin de fuentes de datos y su caducidad, sin necesidad de un rediseo importante. Las fuentes y sus datos evolucionarn y el almacn debe contemplar dichos cambios. El ajuste de los datos fuente disponibles al modelo de datos del almacn constituir un reto continuo. Debido a la rpida y constante evolucin de las tecnologas, tanto las necesidades como las posibilidades del almacn sufrirn una transformacin considerable con el tiempo. Ejemplo de un Data Warehouse En la figura se muestra un ejemplo hipottico de un data warehouse estructurado para un centro de produccin industrial.

Se muestra slo el detalle actual, no as los niveles de esquematizacin ni los archivos de detalle ms antiguos. Adems, se observa que hay tablas del mismo tipo divididas a travs del tiempo. Por ejemplo, para el histrico de la fabricacin de las piezas, hay muchas tablas separadas fsicamente, representando cada una un trimestre diferente. La estructura de los datos es consistente con la tabla de la elaboracin de las piezas, aunque fsicamente hay muchas tablas que lgicamente incluyen el histrico. Para los diferentes tipos de tablas hay diferentes unidades de tiempo que fsicamente dividen las unidades de informacin. El histrico de fabricacin est dividido por trimestres, el histrico de la orden de piezas est dividido por aos y el histrico de cliente es un archivo nico, no dividido por el tiempo.

As tambin, las diferentes tablas son vinculadas por medio de un identificador comn, piezas u rdenes de piezas (la representacin de la interrelacin en el ambiente de depsito toma una forma muy diferente al de otros ambientes, tal como el ambiente operacional).

Conclusin
Estos temas van enfocados a la bsqueda, obtencin, contencin, analizado, comunicacin y transmisin de datos informticos para el desarrollo de soluciones en un sistema semi-cerrado en el cual pueden acceder a esta informacin solo los clientes autorizados y los administradores de una red ya que bsicamente se trasforman unidos en una base de datos muy extensa y con informacin valiosa para el anlisis y obtencin de la informacin. Es de mucha utilidad la comprensin de estas terminologas pues estn enfocadas al rea de inters mutua.

También podría gustarte