Está en la página 1de 38
Capitulo 6 CEC MCMC arm Paar Et CMe Cra) OBJETIVOS DE'APRENDIZAJE) BSQUEMADEL GAPITULO Después de leer este capitulo, 6.1 ORGANIZACION DE DATOS EN UN ENTORNO usted podra: ‘TRADICIONAL DE ARCHIVOS Conceptos de organivacién de archivos fy seaiittit conestos bakin Problemas con el entorne tradiclonal de archivos de la oxganizacion de azchivos y los problemas de admiistrar los 6.2. ENFOQUE DEAS BASES DE DATOS PARA LA recursos de datos en un entorno ADMINISTRAGION DE DATOS tradicional de archivos. Sistemas de administracion de bases de datos Capacidades de los sistomas de administracion de 4, Bete ta seis rs a de ‘bases de datos y las caracteristicas eee eee ae 4 una base de datos relacional 6.3 USO DE BASES DE_DATOS PARA MEJORAR [BL DESEMPENO EMPRESARIAL Y LA TOMA 2. Aplicarlos principios importantes De nnecnes el disetto de bases de datos. ‘Alpine dey ako 4, Bvaluar las herramientas y Inteligencia de negocios, andlisis de tecrologias para proporcionar datos multidimensionales ¥ mineria de datos Informacién de bases de datos Bayes de datos y la Web Baa ingjondt el desempee: 6.4 ADMINISTRACION DE LOS RECURSOS DE DATOS ‘empresarial y la toma de Establecimiento de una politica de informacion penser Aseguramiento de la calidad de datos 5. Evaluar ol rol de la politica de as dagiiacords Sninesatiy aa eileen Mejora en la toma de decisiones: rediseno de la base. edaton y 2 sspginernienter doe de datos de clientes: Dirt Bikes USA lla ap ae nt Loge dela excelencia operativa: construccion de _administracion de 1s recursos una base do datos relacional para administracign de datos de la organizacion. 1s terion ¥ Mojora on la toma do decisiones: busqueda de Sesiones interactivas: recursos empresariles extranjeros en bases de Bases de datos de ADN: Arma datos en linea para luchar contra el crime _MODULOS DB SEGUIMIENTO DEL APRENDIZAJE, ‘@amenaza ala privacidad? Disefio de hases de datos, normalizacién y 2Qné se puede hacer sobre la cali- diagramas entidad-relacion dad de los datos? Introduccion a SQL. Modelos de datos jexarquicos y de red DES awe GSU) camino de convertirse en el deporte eapectaculo més popular de Estados Unidos. En 2005, 75 millones de personas acudieron a las carreras NASCAR, la cantidad mas alta de asisten tes a cualquier deporte en Estados Unidos. Las carzeras NASCAR estin en sogundo lugar de rating televisivo, slo atras de Ia National Football League (NFL). De 1995 a 2004, la hase de af- ‘clonadlos de NASCAR crecié de 63 millones a 75 miflones, y las ventas al detalle de mercancia con eencia de NASCAR se incrementaron mas de 250 por ciento, de aproximadamente 600 millones a 2,200 millones de délares. Las empresas de Fortune 500 patrocinan a NASCAR més que a cualquier ‘otro deporte, Que hay de malo en esta descripcion? No mucho, excepto que la administracion de NASCAR ‘considera que la empresa podria hacer ain mejor las cosas. Crve que puede incrementar ain mas la base de aficionados de NASCAR, especialmente en areas diferentes al sur, donde NASCAR ha si- do tradicionalmente mas popular, Pero NASCAR necesita los datos correctos para identificar quié- res son sus aficionados, y esta teniendo problemas para conjuntar esos datos. Hasta hace cinco afios, NASCAR consideraba que los sistemas de informacion eran meras fum- iones administrativas. Todo su proceso para montar carreras —obtener credenciales para los pa- ‘trocinadores, realizar las carreras, manejar las relaciones con los patrocinadores y pagar a los pilo- tos y sus equipos— ers principslmente manual y basado en papel. Los autodromos no tenian tecnologia pars transmitirefectivamente los datos de las carvers. El panorama cambié cuando NASCAR empez6 a reclutar ejecutives sobresalientes de empresas de Fortune 500, deportivos y de medias ée difusion, quienes apreciaban Io que la TI puede hacer ‘por un negocio, A Roger Lovell, director de Ti de NASCAR, se le dieron todas las facultades para realizar una transformacion de {a empresa con base en la TI Lovell y su equipo de especialistas de sistemas de informacion desarrollaron una infraestructue 1a de TI escalable y estable, estandarizaron la tecnologia de Informacion de la computadora de es- critorio de NASCAR ¢ implementaron wn plan para reforzar la seguridad de los sistemas. Comenza- ron a recopilar mas datos de manera electronica acerca del desempefto de los pilotos durante una ‘carrera y a analizar los datos para que los aficionados pudieran seguir el desemperio de los pilotos de una mancra similar a la que emplean cn el beisbol para analizar los promedios de bateo. En 2006, NASCAR implementé un Centra de Tecnologia Mévil de vanguardia para recopilar y procesar datos sobre el tiempo y las calif- caciones en el momento que se realizaban las carreras, En Ta ac- ‘ualidad, Lovell ¥ Roger VanDer- Snick, vicepresidente de marke- ting de NASCAR, trabajan en 1a conatruccion de una sola y am- pia base de datos de aficionados a los autos de carreras que po- dian compartir con sus socios. de negocios y utilizatla con pro- ppositos de marketing. Esta base Ge dates podria proporcionar un ‘mejor enteradimieno de los perf Jes demograficos, comporiaraien- tos y preferencias de los aficions- dos de NASCAR para dirigirles ofertas come chamarras de la ‘marca NASCAR, oportunidades para conocer alos pilotos durante lascarzeras o productos y servicios de los patrocinadores. Ademas de L 1 National Association for Stock Car Auto Racing, mejor conocida como NASCAR, esté en. 224 Parte Dos infrzestyuctaa de tecalegi de inforaeisn + Desatciaa osatogin + Diseraregias de + Disora uns base de generar ingresos, estas iniciativas podsfan Incrementar la lealtad de los aficionados, ayudar a NASCAR a attacr nuevos patrocinadores y convencer a los existentes de que auumenten los montos de sus patrocinios. La creacion de una base de datos de aficionados consolidada representa in zeto por- que los datos estan almacenados en rmuchas bases de datos diferentes. NASCAR com tiene st propia base de dates, al igual que el club de miembras de NASCAR.y los clu ‘bes de aficionados de cada uno de los pilotos. Es probable que estas bases de datos no almacenen los datos sobre ls aficionados de una manera consistente, asi que los datos tendrén que ser ‘depurados’ de discrepancias, inconsistencias y errores, ¥reestructu- arse para que se ajusten a un formato estindar. NASCAR y sus socios tendrn que os- tablecer reglas para utilizar una base de datos de aficionados consalidada, com la final ad de que los aficionados de NASCAR no sean bombardeados con un exceso de anuncios de marketing y que se respeten los acuerdos de privacidad que las cscude- las, los pilotos y los patrocinadores hayan establecido con sus propios aficionados. Sto- neacre Partners, que construyo una base de datos relacional para el Club de Miembros Oficial de NASCAR, esta a cargo del proyecto. Fuentes: Meriith Levinson, “IT Supercharges NASCAR’, CIO Magazine, 1 de febrero de 2006, y K.G Jones, NASCAR Revs Up Data Center on Wheels’, bnormation Wee, 19 de mayo de 2006, TL tetteioneia de NASCAR itl importance dl amnistaion de - tos ¥ de los sistemas de bases de datos para las empresas. NASCAR ha experi- mentada un crecimiento fenomenal, Pero su crecimiento y su desempero fururos dependen de lo que pueda o-1n0 pueda hacer com Ios datos de sus clientes. La mane- ‘ren que las empresas almacenan, organizan y administran sus datos tiene un gran impacto en la efectividad de la organizacion. 4B] diagrama con que comienza el capitulo resalta puntos importantes derivadas de este caso-y este capitulo. Los datos acerca de los aficionados de NASCAR y de los, clientes potenciales han sido almacenados en una gran cantidad de bases de datos diferentes desde las cuales no ge pueden recuperar y analizar ficilmente. La admi- nistracion decidio que la estrategia de negocios de NASCAR necesitaba enfocarse en crear buenas relaciones con el cliente, lo cual requerta integrar los datos de to- das estas fuentes diferentes en una sola y amplia base de datos de aficionados. Ade- ‘ds de utilizar la tecnologia adecuada, NASCAR tnvo que corregir y reorganizar los datos en un formato estandar y establever reglas con sus socios de negocios para ac- coder a la informacion de la nuova base de datos + Fata de conaciniero ste cies 1 Dates ragrreniados cel conto hace el cient ‘Clebora con os ‘soci de negocios ‘eceso a8 datos + invemerta los mgresos 1 Consoldalscatos + Inowmentala procucvded elalerte + -Araiza as profeencias aleterte datos oa cirtes mpl ‘nize ornaagia do ase te dao ‘olsen «Evraz e insect Capitule 6 Fundamentos dela intligencia de negocos:adminitraclén de bases de datas Informacion 225, ATENCION Este capitulo se enfoca en la administracién de datos y en la manera en que las empresas utilizan la tecnologia de base de datos paza alcanzar sus objetivos. Una vez que las empresas utilizan sistemas de administracion de bases de datos pata organizar adecuadamente sas datos, esos datos deben ser analizados. La in- formacion resultante se puede utilizar para desarrollar nuevos negocios, lograr Ja excalencia operativa, comunicar las decisiones de la administracion y ayudar ala empresa a cumplir sus requerimientos de presentacion de informes reela- rmentarios. Empresas completas como UPS, compalias de tarjetas de exédito y Google, se cimientan en bases de datos. No seria una exageracion afirmar que 1s bases de datos son el fundamento de las empresas actuales y que la mayoria de éstasfracasarian si sus bases de datos dejaran de exist ‘Sia érea som las fnanzasy la contabilidad,trabajara oon bases de datos de transacciones financieras, coma pages, factaras 0 historiales crediticios. Si sa traba- Jo son ls finanzas,trabajaré con bases de datos enormes que almacenan datos s0- ‘bre precios de valores, carteras de inversin y estadisticas econémicas ‘+ _ isu drea son los recursos humanos, trabajara con bases de datos que alber- sgn datos sabre empleados, planes de prestaciones, planes de rermuneraciones, pro- fsramas de capacitacion y cumplimiento de reslamentaciones gubernamentalesso- bre salud, seguridad y oportunidades equitativas de empleo. ‘+ _Sisu drea son los sistemas de informacién, desemapefiara un 101 importante en el suninistzo de herramlentas de administracion de datos y canocimientas es pecializados a Ta empresa. Usted diseAtard bases de datos, implementara y dara ‘mantenimiento a la tecnologia de bases de datos y ayudard a promaver la creacién de politicas y procedimientos para la administracion de datos. ‘+ Sion dreaes la mannfactur, Ja produccién o la administracion de operacio- nes, trabajar con grandes bases de datos que contienen informacion sobre produc tos terminados, materia prima en inventari, proveedores, componentes de los productos, calidad del producto y articulos en transito que se pueden utilizar para ‘a administracion dela cadena de sumialsteo. ‘+ Sisu drea son las ventas y el marketing, tilizard bases de datos para dar se ‘guimienta a las compras de los clientes, analiza datos sobre los clientes para dirt pirles campafas de marketing o identifica a los clientes y productos rentables ORGANIZACION DE DATOS EN UN ENTORNO TRADICIONAL DE ARCHIVOS 2 sistema efectivo de informacion da a los usuarios informacion exact, ‘oportuna y relevante, La informacion exacta esta Ube de errores. La in- formacion es oportuna cuando esté disponible en el momento que la reqjuieren los encaryas de la toma de decsiones, La informaciGn es e- levante cuando es itil y adecuada para los tipos de trabajo y decisiones que la ‘Se sorprenderia de saber que muchas empresas no cuentan con informacion coportuna, exact orelevante porque los datos de sus sistemas de informacion estan ‘mal organizados y con un mantenimiento deficiente. A est se debe que la adminis- tracién de datos sea tan importante. Para entender el problema veamos la manera cen que los sistemas de informacion orpanizan los datos en archivos de computado- ‘los métodos tradicionales de administacion de archivos 226 Parte Dos Infraestructra de txnolola se nformacién CONCEPTOS DE ORGANIZACION DE ARCHIVOS Un sistema de computo organiza los datos en una jerarauia que empieza con bits ¥ bytes y avanza a campos, regisiros, archivos y bases de datos (vea la figura 7-1), Un bit representa la unidad mas pequefta de datos que puede manejar una computadora. Un grupo de bits, lamado un byte, representa un caracter, cual puede ser una letra, ‘un ndmero u otto simbolo. Una agrupacisn de caracteres en una palabra, un grupo de palabras 0 un niimero completo (como el nombre o la edad de una persona) se lla- ‘ma campo, Un grupo de campos relacionados, como el nombre de un estudiante, el curso que toma, la fecha y el grado, conforma un registro; un grupo de registros del ‘mismo tipo se lama archivo. Por ejemplo, los registros de la figura 6-1 podrian constituir el archivo de un cur- so de un estudiante, Un grupo de archivos relacionados forma una base de datos, El archivo de curso del estudiante que se ilustra en Ia figura 6-1 se podria agrupar ‘con archivos sobre Ios antecedentes personales y financieros de los estudiantes pa- 1a crear una base de datos de estudiantes. Un registro describe una entidad. Una entidad es una persona, lugar, cosa 0 evento sobre el cual se almacena y conserva informacién. Gada caracteristica 0 cua- lidad que describe a una entidad en particular se llama atributo, Por ejemplo, FIGURA 6-1 — LAJERARQUIA DE DATOS Un sistema de cmputo organiza os datos en unajerarquia que empieza cone bit cual representa ya see un 0.0 un 1 Los bits se pueden agrupar para formar un byte para representar un carter, n> ‘mero o sibolo. Los bytes se pueden agrupar para formar un carga yas cargos reaconads se pueden agrupar paca formar un regis. Los reaitos relacionados se gueden conjuntar pare fot un archivo yls archivos relacionados se pueden organiza en una base de datos. [Capitulo 6 Fundarntos de la intligencia de negocios: administracén bases de datos informacion 1D_Estudiante, Curso, Fecha y Grado son atributos de la entidad CURSO. Los valo- res especificos que pueden tener estos atributos se encuentran en los campos del registro que describen la entidad CURSO. PROBLEMAS CON EL ENTORNO TRADICIONAL DE ARCHIVOS En la mayoria de las organizaciones, los archivos do datos y los sistemas marcaban tuna tendencia a crecer de manera independiente sin ajustarse a un plan 2 nivel de toda ls empresa, Contabilidad, finanzas, manufactura, recursos humanos y ventas Y ‘marketing, desarrollaban sus propios sistemas y archivos de datos. La figura 62 ‘Dustra el enfoque tradicional del procesamiento de la informacton, Desde luego, para operar, cada aplicacion requerta sus propios archivos ¥ su pro- pio programa de cémputo. Por ejemplo, el departamento de recursos humsnos po ia contar con un archivo maestro de personal, un archiva de némina, un archivo ide seguros médicos, un archivo de pensiones, um archivo de listas de correo y asi hhasta que se creaban decenas, tal vex cientos, de archivos y programas. El departa- mento de finanaas también podia contar con un archivo de némina, un archivo de pensiones y una lista maestra de empleados para operar la ndmina. Al considerar = Ta compania en su conjunto, este proceso conducia a multiples archivos maestros ‘creados, conservados y operados par divisiones 0 departamentos separados, Al cibo de 5 0 20 afos, la organizacion se encuentra con una carga de cientos de programas yy aplicaciones muy dificiles de mantener y manejar. Los problemas resultantes son. redundancia e inconsistencia de datos, dependencia entre los programas y los da- tos, inflexibilidad, una escasa seguridad de datos y la incapacidad de compartir datos entre aplicaciones. FIGURA 6-2 PROCESAMIENTO TRADICIONAL DE ARCHIVOS Archivo meesto| lomeos ‘los ce leAelez Archives deivadca. CONTASILIDAD | ‘YFINANZAS: ECURSOS >| 1 HUMANS ee VENTAS Y MARKETING gia emt Else de un métoda tradicional para procesar archivos alienta a cada dea funcional de una corpo ‘Gbn a desarllar aplicaciones especialaadasy archivos. Cada aplicacnrequere un archivo de datos ‘nico que probablementeseré un subconjunto del archivo maestra. Estos subconjunts dl archivo ‘maesto conducen a redundancl e Inconsistent de datos, iefleibiidd ene procesamiento y recursos de almaceramienta cespercicados. 227 228 Parte Dos tn‘rzesructura de tenolagla de Iformacién Redundancia e inconsistencia de datos La redundancia de datos es ia presencia de datos duplicados en multiples archivos de datos, de tal manera que los mismos datos estn almacenados en mas de un lugar. a redundancia de datos ocurre cuando diferentes grupos de una organizacién capturan de manera independiente la misma pieza de informacién y la almacenan también de manera independiente de los demas grupos. La redundancia de datos desperdicia recursos de almacenamniento y también conduce a la inconsistencia de datos, en la cual el mismo atributo podria tener valores diferentes. Por cjemplo, en Js instancias de la entidad CURSO que se dlustra en la figura 6-1, la Fecha podria ac- ‘ualizarse en algunos sistemas pero no en los demas. El atributo ID_Estudiante po- dria toner diferentes nombres en los diferentes sistemas de la organizacion. Por ejemplo, algunos sistemas podsian utllizar ID_Estudiante y otros, solo ID. ‘Al utlizar diferentes sistemas de codificacion para representar los valores de un atributo se podria generar confusién adicional. Por ejemplo, los sistemas de ventas, Inventario y manufactura de un detallista de ropa podrian usar codigos diferentes par ‘a reptesentar el tamafio de una prenda. Un sistema podria representar el tamavio de Ja prenda como “extra grande’, en tanto que otro utlizaria el cédigo “XL! con el mismo proposito. La confusion resultante dfcultarfa que las compaiias crearan sistemas de ‘administracién de las relaciones con el cliente, de administracién do la cadena de su- _ministro 0 empresariales, que integraran los datos desde fuentes diferentes, Dependencia entre los programas y los datos La dependencia entre los programas y los datos se refiere a la estrecha relacion entre los datos almacenados en archivos y los programas especificos que se requie- ren para actualizar y mantener esos archivos, de tal manera que los cambios en los programas requieren cambios a los datos. Todo programa tradicional de computo tiene que describirla ubicacién y naturaleza de Tos datos con que trabaja. En un en- ono tradicional de archivos, cualquier cambio en un programa de software podria requerir un cambio en los datos a que accede ese programa. Por ejemplo, un pro- ‘grama se podria modificar para aceptar un codigo postal de nueve digitos en lugar de cinco digitos. Silos cédigos postales de cinco digitos se cambiaron a nueve digi- ‘tps en el archivo original de datos, entonces otros programas que requieren el cédi- {go postal de cinco digitos no fincionarian adecuadamente, Implementar tales cam bios de manera apropiada podria costar millones de dolares, Carencia de flexibilidad Un sistema tradicional de archivos puede enviar informes programados de rutina después de extensos esfiuerzos de programacién, pero no puede transmitirinformes con fines especifices 0 responder de manera oportuna a requerimientos imprevis- tos de informacion. La informacion requerida por las solicitudes con fines especiti- ‘cos esta en alain lugar del sistema pero podria ser demasiado costoso recuperarla ‘Varios programadores tendrian que trabajar durante semanas para reunir en un nueva archivo los elementos de datos requerides. Seguridad escasa ‘Dado que hay poco control o administracién de datos, el acceso y la difusion de la informacion podrian salirse de control. Es posible que la administracion no tenga forma de saber quién esté teniendo acceso a los datos de la organizacién, o incluso modificandolos. Carencia de comparticién y disponibilidad de los datos Debido a que la informacion esta fragisientada en diferentes archivos y en distintas, partes de Ia organizacion no se pueden relacionar entre si, es practicamente impo- sible que la informacion se comparta o se acceda de manera oportuna. La informa- cidn no puede fluir ibremente a través de las diferentes areas funcionales o distin- tas partes de la organizacion, Si los usuarios encuentran diferentes valores de Ia ‘misma pieza de informacién en dos sistemas distintos, tal vez no deseen utilizar es- tos sistemas porque no pueden confiar en la exactitud de sus datos, Capitulo & Fundarentos de la inteligecia de negocios: adinistactén de bases de datos eiformacisn ENFOQUE DE LAS BASES DE DATOS PARA LA ADMINISTRACION DE DATOS 1a tecnologia de bases de datos puede reducir muchos de ios problemas que origina Ja organizacidn tradicional de archivos. Una definicién mas rigurosa de una base de datos es un conjunto de datos organizados para servir eficientemente a muchas aplicaciones al centralizar los datos y controlar su redundancia. En vez de que los datos se almacenen en archivos separados para cada aplicacién, se guardan fisica- ‘mente para que se presenten a los usuarios como si estuvieran almacenados en un solo lugar. Una sola base de datos da servicio a miilkiples aplicaciones. For ejemplo, en ver de que una corporacién almacene los datos de sus erpleados en sistemas de informacién separados y en difezentes archivos para personal, némina y prestacio- nes, podria crear una sola base de datos comin de recursos humanos. SISTEMAS DE ADMINISTRACION DE BASES DE DATOS Un sistema de administracién de bases de datos (DBMS) es l software que per mite 2 una organizacion centralizar los datos, administrarlos eficientemente y pro- porcionar, mediante los programas de aplicacion, el acceso alos datos almacenados E] DBMS actiia como una interfaz entre los programas de aplicacion ¥ los archivos de datos fisicas. Cuando el programa de aplicacién solicta un elemento de datos, ‘como el suelde bruto, e] DBMS encuentra este elemento en Ia base de datos y lo presenta al programa de aplicacién, Si uilizara los archivos de datas tradicionales, el programador tendria que especificar el tamafi y el formato de cada elemento de datos utilizado en el programa e indiear la compuiadora en que se localizaran. ‘Al separar las visas logica y fisica de los datos, el DBMS libera al programador 0 al usuario final de la tarea de comprender donde y como se almacenan realmente Jos datos. La visa lgica presenta los datos como los dcberian percibir los usuarios finales o los especialistas de la empresa, en tanto que la vista fisica muestra como estin organizados ¥ estructurados realmente los datos en un medio de almacona: iento fisico. El software de administracion de buses de datos hace disponibles las diferentes, vistas logicas de la base de datos fisica requeridas por los usuarios. Por ajemplo, pe ri labase de datos de recursos humanos jlustrada en la figura 6-3, un especialista en prestaciones podria requerir una vista consistente del nombre, mlimero del seguro ‘social y cobertura del seguro médico del empleado. Un miembro del depariamento de némina podria necesitar datos como el nombre, nlimero del seguro social, suel- do bruto y sueldo neto de! empleadi. Los datos para todas estas vistas se almacenan ‘en tna sola base de datos, donde la organizacién los puede mangjar de una manera, mas sencilla Cémo resuelve un DBMS los problemas del entorno de archivos tradicional (Un DBMS reduce la redundancia y la inconsistencia de datos al minimizar la canti- dad de archivos aislados en los cuales se repiten los mismos datos. Quizd el DBMS no permits a la organizacion eliminar por completo la redundancia de datos, pero puede ayudarle a controlarla. Aun cuando la organizacién conserve algunos datos redundantes, un DBMS elimina la incansistencia de los datos porque puede ayudar ala organizacion a asegurarse de que todas las ocurrencias de los datos redundantes, ‘tengan los mismos valores. El DEMS elimina la dependencia entre los programas ¥ Jos datos, permitiendo a estos iltimos ser autosuficientes. El acceso y la disponibili- dad de la informacion se incrementardn y los costes del desarrollo y el manteni- _miento de los programas se reduciran porque los usuarios ¥ los programadores puc- den realizar consultas con fines especificos de la informacién que contiene la base de datos. El DMBS da a 1a organizaci6n la posibilidad de centralizar la administra ign de datos, su uso y seguridad, 29 230 Parte Dos infrasiructra de tecnolota de informacién FIGURA 6-3 BASE DE DATOS DE RECURSO HUMANOS CON MULTIPLES VISTAS Visa de retacones Vista ge aso do gatos co eoutsos manos Une sols base de datos de recursos hurisnasproporiana muchas Visas de datos diferentes, sean os requerimientas de informacion del usuario. Aqui susan dos pasibles wists, una pare un espe- Calista en prestaionesy una para un miembro del departamenta de ndrina de la empresa DBMS relacional Los DBMS contemporineos utilizan diferentes modelos de bases de datos para dar seguimfento a las entidades, atributos y relaciones. Actualmente, el tipo mas popu lar de DEMS para PCs, asi corso para computadoras mas grandes y mainframes, es €1 DBMS relacional. Las bases de datos relacionales representan ios datos coma ta- ‘blas bidimensionales (Uamadas relaciones). Las tablas podrian considerarse como archivos. Cada tabla contiene datos acerca de una entidad y sus atributos. Microsoft ‘Access es un DBMS relacional para sistemas de escritorio, en tanto que DB2, Oracle Database y Microsoft SQL Server son DBMS relacionales para mainframes y compu tadoras de rengo medio. MySQL es un popular DBMS de cédigo abierto, y Oracle Database Lite es un DBMS para pequetios dispositivos de cémputo portitiles. ‘eamos como una base de datos relacional organiza los datos de proveedores ¥ ‘partes (vea la figura 6-4). La base de datos tiene una tabla independiente para la en- {dad PROVEEDOR y otra para la entidad PARTE. Ambas tablas constan de una cua Arigula de columnas y filas de datos. Los elementos de datos individuales para cada fentidad se almacenan como campos independientes, y cada campo representa unt atributo para esa entidad. Los campos de una base de datos relacional también se de~ ‘nominan columnas. Para la entidad PROVEEDOR, el nimero, nombre, calle, ciudad, estado y cédigo postal del proveedor se almacenan como campos separados dentro de la tabla PROVEEDOR y cada campo representa un atributo para la entidad PRO- ‘VEEDOR. La informacion real sobre un solo proveedor que se encuentra en una tabla se denomina fila. For Jo general, a las fas se les llama registros, o en términos muy tecnicos, tuplas. Los datos de la entidad PARTE tienen su propia tabla separada El campo para el Numero_Proveedor de la tabla PROVEEDOR identifica de ma- nera tnica cada registro con fa inalidad de que se pueda recuperar, actwalizar o cla~ sificar, y se denomina campo clave, Cada tabla de una base de datos relacional tie- ne un campo designado como elave principal. Este campo clave es el identificador ‘nico pata toda la informacion en cualquier fila de la tabla y su clave principal no s¢ puede duplicar Numero_Proveedor es la clave principal para la tabla PROVEE- DOR y Numero_Parte es la clave principal para la tbla PARTE. Observe que Nume- ro_Proveedor aparece tanto en la tabla PROVEEDOR como en la tabla PARTE. En la Capitulo 6 Fundamentos de Ia inteligencia de neoocos: aémiisraeén de bases de datage informaclén 231 FIGURA 6-4 TABLAS DE UNA BASE DE DATOS RELACIONAL, PROVEEDOR CColumnas atibutos, campos) (clave prinelpal) PARTE Clave principal ‘clave axtorna Una ase de datos relcionl organiza los dats en forma de tabla bidimensionaes. Agu se iustran las tables pa las entidades PROVEEDOR y PARTE que muestan cbmorepresentan a cada entdady sus trout. Numero_Proveedor es una cave pinclal paral tabla PROVEEDOR yuna clave extesna para a tabla PARTE, tabla PROVEEDOR, Numero_Proveedor es ls clave principal. Cuando el campo Nu- ‘mero_Proveedor aparece em la tabla PARTE se denorsina clave externa y en esen- cia es un campo para buscar datos sobre el proveedor do una parte espectfica Operaciones de un DBMS relacional Las tablas de una base de datos relacional se pueden combinar fieilmente para en- \uegar los datos requeridos por los usuarios, siempre y cuando dos tablas compaxtan tun elemento de datos cormtin. Suponga que necesitamos encontrar en esta base de datos los nombres y direcciones de proveedores que puedan surninistramos la par- ‘te milmero 137 0 la nlmero 150, Necesitariamos informacion de dos tablas: PRO- VEEDOR y PARTE. Observe que estos dos archivos tienen un elemento de datos compartidar Numero Proveedor ‘En una base de datos relacional se utilizan tres operaciones bisicas, como sc ‘muestra en la figura 6-5, para generar conjutos de datos dtles: seleccionar, proyeo- tar y uniz. La operacién seleccionar crea win subconjunto que consta de todas los re- gistros (flas) dela tabla que cumplen los criterios establecidos. En nuestro ejemplo queremos seleccionar registros (fas) de la tabla PARTE donde el niimero de la par- te sea 2 137 0 150. La operacion unir combina tablas relacionales para dar al usuario ‘mas informacién de Ta que esté disponible en las tablas individuales. En nuestro 232 Parte Dos Infrastructura de teenolesia de informacién Sopevonnais sotnque so vais bajdsap & saya sejge op ap sole So euqWe> Layiad sun A setafaxd “evo sauoDeLado So] ‘TWNOIOV7au Sw Nn 30 Svoisya SNOIOVAIdO S3ML SVT 5-9 YUNIS Capitulo 6 Fundamentos dela intligncia de negocios: aministracion de bases de datos informacién 233, ejemplo deseamos unir la tabla PARTE ahora abreviada (s6lo se presentarin las par- tes 137 0 150) y la tabla PROVEEDOR para formar una sola tabla nueva. ‘La operacién proyectar crea un subconjunto que consiste en las columnas de una tabla, lo cual permite al usuario crear nuevas tablas que contengan solamente la in- formacion que se requiere. En nuestro ejemplo, necesitamos extraer de la nueva ta- bla solamente las siguientes columnas: Numero. Parte, Nombre_Parte, Numero_Pro- veedor y Nombre_Proveedor. DBMS jerarquico y de red Usted podria encontrarse con viejos sistemas que utilicen un DBMS jerérquico o uno de red. Un DBMS jerdrquico modela relaciones uno a muchos, en tanto que uno de red madela relaciones muchos a muchos. Los DBMS jerarquicas y los de red ya no se utilizan para construir nuevas aplicaciones para bases de datos. Son mucho menos flexibles que los DBMS relacionates y no soportan consultas con fines especificos, ‘como las consultas de informacion en lenguaje natural. En el médulo de seguimien- to del aprendizaje de este capitulo, localizado en el sitio Web del libro, encontrar ‘mas detalles sobre la manera en que funcionan estos DBMS. ‘Los DBMS relacionales tienen mucho més flexibilidad para proporcionar datos ‘en consulias con fines especificos, combinar informacién de diferentes fuentes, y ‘agregar nuevos datos y registros sin alterar los programas y las aplicaciones existen- tes. Sin embargo, estos sistemas se vuelven lentos si requieren acceder una gran ccantidad de veces a los datos almacenados en el disco para ejecutar los comandos seleccionar, unir y proyectar. Desde luego, es posible afinar la base de datos para acelerar consultas predeterminadas. DBMS orientados a objetos ‘La gran mayoria de aplicaciones actuales requieren bases de datos que tengan la ccapacidad para almacenar y recuperar registros que no s6lo contengan mimeros Y caracteres, sino tambien dibujos, imagenes, fotografias, voz y video. Los DEMS ‘isefiados para organizar datos estructurados en flas y columnas no son muy ade- ‘cuados para manejar aplicaciones de graficos 0 multimedia. Las bases de datos orientadas a objetos son mas adecuadas para este prop6sito. For ejemplo, una em- presa arquitect6nica maneja principalmente objetos y dibujos mas que registros de texto estructurados. ‘Un DBMS orientado a objetos almacena los datos y los procedimientos que tealizan operaciones sobre estos datos como objetos que se pueden recuperar y ‘compartir de manera automitica, Los sistemas de administracién de bases de datos crientadas a objetos (CODBMS) se estdn popularizando poraue se pueden emplear para manejar Ios diversos componentes multimedia o subprogramas de Java que se utilizan en las aplicaciones para la Web, las cuales cominmente integran la infor. ‘macion fragmentada de diversas fuentes. "Aunque las bases de datos orientadas a objetos pueden almacenar tipos de infor- ‘macin mas complejos que los DBMS relacionales, son relativamente lentas compa- radas con los DBMS relacionales para procesar grandes cantidades de transaccio- nes. Ya estan disponibles los sistemas hibridos DBMS relacional—orientado a ‘objetos, para proporcionar capacidades de DBMS orientado a objetos y relacional. CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACION DE BASES DE DATOS Un DBMS incluye capacidades y herramientas para organizar, manejar y acceder a Ia informacion de una base de datos. Las més importantes son su capacidad de defi- nicién de datos, su diccionario de datos y su Tenguaje de manipulacién de datos. ‘Un DBMS tiene una capacidad de definicion de datos para especificar la estruc> tura del contenido de la base de datos, Esta capacidad se podria utilizar para crear tablas de bases de datos y para definir las caracteristicas de los campos de cada ta- }bla. Esta informacion acerca de la base de datos podria documentarse en un diccio- 234 Parte Dos Iniraestrvcuts de tecnologia de infermacién nario de datos. Un diccionario de datos es un archivo automatizado o manual que almacena definiciones de elementos de datos y sus caracteristicas. Microsoft Access integra una caracteristica rudimentaria de diccionario de datos que despliega informacion sobre nombre, descripcién, tamano, tipo, formato y otras propiedades de cada campo de una tabla cuando se trabaja en la vista Disefio © cuando se emplea el Documentador. Los diccionarios de datos para grandes bases de datos corporativas podrian captar informacién adicional, como la propiedad (quien es responsable de dar mantenimiento alos datos en la organizacion), autor zacion, seguridad, y los individuos, fanciones de negocios, programas e informes que utiliza cada elemento de datos (vea la figura 6-5). Elaboracién de consultas e informes Un DBMS incluye herramientas para acceder y manipular la informacion de una base de datos. La mayoria de los DBMS tiene un lenguaje especializado llamado enguaje de manipulacién de datos, el cual se utiliza para agregar, cambiar, eli- minar y recuperar la informacion de la base de datos. Este lenguaje contiene co- mandos que permiten que los usuarios finales y los especialistas en programacién extraigan datos de la base de datos para satisfacer requerimientos de informacion y

También podría gustarte