Está en la página 1de 118

Gua para el uso de

NeuralTools
Programa auxiliar de redes neuronales para Microsoft Excel

Versin 5.7 septiembre, 2010

Palisade Corporation 798 Cascadilla St. Ithaca, NY 14850 EE.UU. +1-607-277-8000 +1-607-277-8001 (fax) http://www.palisade.com (pgina Web) sales@palisade.com (correo electrnico)

Copyright
Copyright 2010, Palisade Corporation.

Reconocimiento de marcas comerciales


Microsoft, Excel y Windows son marcas comerciales registradas de Microsoft Corporation. IBM es una marca comercial registrada de International Business Machines, Inc. Palisade, TopRank, BestFit y RISKview son marcas comerciales registradas de Palisade Corporation.

Bienvenidos a NeuralTools para Excel


Bienvenidos
NeuralTools ofrece a Microsoft Excel el programa de modelacin y anlisis de datos estndar de la industria- un nuevo y eficaz grupo de herramientas de modelacin. NeuralTools es un programa auxiliar de redes neuronales para Microsoft Excel que permite analizar datos en las hojas de clculo de Excel y trabajar en el entorno familiar de Microsoft Office. Combinando un eficaz administrador de datos y los ms modernos algoritmos de redes neuronales, NeuralTools ofrece lo mejor de dos mundos: la facilidad de uso y los informes de Microsoft Office, y las predicciones slidas y precisas de las redes neuronales.

Trabaje con la mayor comodidad


Si sabe cmo usar Excel, sabr usar NeuralTools. NeuralTools funciona como lo hace Excel, con barras de herramientas, mens y funciones personalizadas de hojas de trabajo, y todo ello dentro de Excel. A diferencia de los programas de redes neuronales de funcionamiento independiente, con NeuralTools no hay una pronunciada curva de aprendizaje ni costos iniciales de formacin, porque se trabaja como usted trabaja en Excel. Los datos y variables estn en hojas de clculo de Excel. Puede usar frmulas estndar de Excel para hacer clculos as como tablas de pivote y ordenacin de Excel. Los informes y grficas de los anlisis se ofrecen en el formato estndar de Excel y pueden utilizar todas las funciones de formato incorporadas de Excel.

Bienvenidos a NeuralTools para Excel

Anlisis de NeuralTools
Las redes neuronales son capaces de aprender complejas relaciones de datos. Al imitar las funciones de un cerebro, pueden diferenciar patrones de datos y luego extrapolar predicciones cuando se introducen nuevos datos. Los problemas en los que se usan redes neuronales se pueden dividir en dos grupos generales: Problemas de clasificacin: Problemas en los que se trata de determinar el tipo de categora al que pertenece un elemento desconocido. Como ejemplo estn los diagnsticos mdicos o las predicciones de capacidad de pago de un crdito. Problemas numricos: Situaciones en las que debe predecir un resultado numrico especfico. Como ejemplo estn la previsin del precio de acciones o la prediccin del nivel de ventas durante un periodo de tiempo futuro.

Las redes neuronales se usan en una amplia variedad de aplicaciones, que incluyen: predicciones en el mercado de valores, asignacin de riesgo en crditos y prstamos, deteccin de fraude crediticio, previsiones de ventas, previsiones comerciales en general, riesgo en inversiones, diagnsticos mdicos, investigacin cientfica y sistemas de control. NeuralTools incorpora los ms modernos algoritmos de redes neuronales para hacer las mejores predicciones tanto en problemas de clasificacin (denominados prediccin de categora en NeuralTools) como en problemas numricos.

ii

Bienvenidos

Administracin de datos en NeuralTools


NeuralTools proporciona un completo administrador de conjuntos de datos y variables que funciona dentro de Excel, similar al que proporciona StatTools, el programa auxiliar estadstico para Excel creado por Palisade. Se puede definir un nmero ilimitado de conjuntos de datos, cada uno con las variables que desea analizar, directamente en los datos de Excel. NeuralTools evala inteligentemente los bloques de datos, sugiriendo nombres y tipos de variables as como ubicaciones de datos. Los conjuntos de datos y variables pueden residir en diferentes libros de trabajo y hojas de clculo, permitindole organizar los datos como mejor le convenga. Luego, puede entrenar las redes neuronales que hacen referencia a las variables, en lugar de tener que seleccionar de nuevo los datos una y otra vez en Excel. Y las variables de NeuralTools no estn limitadas en su tamao a una sola columna de datos de una hoja de clculo de Excel; puede usar la misma columna a lo largo de hasta 255 hojas de clculo para una sola variable.

Informes de NeuralTools
Excel es ideal para informes y grficos, y NeuralTools lo aprovecha al mximo. NeuralTools usa grficos con formato de Excel, que se pueden personalizar fcilmente con nuevos colores, fuentes y texto. Los ttulos de los informes, formato de los nmeros y texto se puede cambiar como en cualquier hoja de clculo estndar de Excel. Arrastre y coloque tablas y grficas de los informes de NeuralTools directamente a sus propios documentos de otras aplicaciones. NeuralTools Industrial tambin incluye prediccin en vivo, que permite calcular los valores de prediccin cuando se introducen nuevos datos en la hoja de clculo de Excel. Estos clculos en vivo se producen automticamente, como los dems reclculos de Excel.

Bienvenidos a NeuralTools para Excel

iii

Acceso y distribucin de datos


Excel tiene excelentes funciones de importacin de datos, por lo que incorporar datos existentes a NeuralTools es muy fcil. Use las funciones estndar de Excel para importar datos de Microsoft SQL Server, Oracle, Microsoft Access o cualquier otra base de datos que respalde ODBC. Cargue datos de archivos de texto o de otras aplicaciones; si lo puede introducir en Excel, lo puede usar en NeuralTools. NeuralTools almacena todos los resultados y datos en libros de trabajo de Excel. Como con cualquier otro archivo de Excel, podr enviar resultados y redes de NeuralTools a sus colegas. Compartir datos no puede ser ms fcil.

Las versiones Profesional e Industrial de NeuralTools


NeuralTools se ofrece en dos versiones: Profesional e Industrial. Las diferencias son las siguientes: Los conjuntos de datos en NeuralTools Profesional estn limitados a 1000 casos, mientras NeuralTools Industrial respalda conjuntos de datos de hasta 16,777,216 casos. La prediccin en vivo, que permite calcular los valores de prediccin cuando se introducen nuevos datos en la hoja de clculo de Excel, slo se ofrece en NeuralTools Industrial. Estos clculos en vivo se producen automticamente, como los dems reclculos de Excel.

iv

Bienvenidos

ndice
Captulo 1: Introduccin 1 Introduccin ........................................................................................3 El contenido del paquete ........................................................................3 Lo que incluye el paquete.......................................................................3 Informacin sobre esta versin .............................................................3 El sistema operativo.................................................................................4 Cmo obtener ayuda................................................................................4 Requisitos del sistema de NeuralTools ...............................................6 Instrucciones para la instalacin......................................................7 Instrucciones generales de instalacin.................................................7 Configuracin de los iconos y de los accesos directos de NeuralTools...............................................................................................8 Los programas de DecisionTools Suite................................................9 Activacin del software....................................................................11 Captulo 2: Introduccin a NeuralTools 15

Introduccin ......................................................................................17 Para qu sirven las redes neuronales? ..............................................17 NeuralTools y las redes neuronales....................................................18 El men y la barra de herramientas de NeuralTools .......................19 Conjuntos de datos y el Administrador de conjunto de datos ......20 Entrenamiento de una red neuronal ...................................................22 Prueba de una red ..................................................................................27 Prediccin ................................................................................................29 Informes y grficas de NeuralTools ...................................................31 Utilidades de NeuralTools ...................................................................32 Uso de NeuralTools con StatTools, Solver y Evolver......................32 Captulo 3: Gua de referencia de NeuralTools 35

Introduccin ......................................................................................37 Referencia: Iconos de NeuralTools 39

La barra de herramientas de NeuralTools......................................39


ndice v

Referencia: Comandos del men de NeuralTools

41

Introduccin...................................................................................... 41 Iconos de los cuadros de dilogo........................................................ 42 Referencia de comandos................................................................. 43 El comando Administrador de conjunto de datos........................... 43 El comando Entrenar............................................................................. 50 El comando Probar ................................................................................ 64 El comando Predecir ............................................................................. 71 Utilidades .......................................................................................... 77 El comando Configuraciones de aplicacin ..................................... 77 El comando Administrador de red neuronal.................................... 81 El comando Utilidades de reemplazo de datos................................ 83 Informacin adicional sobre redes neuronales 87

Fundamentos de las redes neuronales.......................................... 87 Redes neuronales y mtodos estadsticos......................................... 88 La estructura de una red neuronal...................................................... 88 Prediccin numrica y de categoras.................................................. 89 Entrenamiento de una red ................................................................... 89 Procesamiento en computadora de las redes neuronales............... 90 Tipos de redes neuronales ................................................................... 90 Redes multinivel siempre hacia adelante...................................... 91 La arquitectura MLF ............................................................................. 91 Entrenamiento de una red MLF.......................................................... 93 Redes neuronales de regresin generalizada y redes neuronales probabilsticas............................................................................... 97 Redes neuronales de regresin generalizada ................................... 97 Redes neuronales probabilsticas..................................................... 100 Comparacin de redes MLF y redes PN/GRN ............................. 103 Transformacin de valores de entrada ........................................ 105 Obras recomendadas..................................................................... 107 ndice 109

vi

Captulo 1: Introduccin
Introduccin ........................................................................................3 El contenido del paquete ........................................................................3 Lo que incluye el paquete.......................................................................3 Informacin sobre esta versin .............................................................3 El sistema operativo.................................................................................4 Cmo obtener ayuda................................................................................4 Requisitos del sistema de NeuralTools ...............................................6 Instrucciones para la instalacin......................................................7 Instrucciones generales de instalacin.................................................7 Configuracin de los iconos y de los accesos directos de NeuralTools...............................................................................................8 Los programas de DecisionTools Suite................................................9 Activacin del software....................................................................11 @RISK 4.5 Help System Palisade Corporation, 1999

Captulo 1: Introduccin

Introduccin
Esta introduccin describe los contenidos del paquete de NeuralTools y explica cmo instalar NeuralTools e incorporarlo a su copia de Microsoft Excel 2000 para Windows 2000 o posterior.

El contenido del paquete


El paquete de NeuralTools debe contener: El CD-ROM de NeuralTools o DecisionTools Suite, que incluye: El programa NeuralTools El tutorial de NeuralTools La Gua para el Uso de NeuralTools (este libro) en formato .PDF

El Acuerdo de Licencia de NeuralTools Si el paquete que usted recibi no est completo, llame al vendedor o al distribuidor de NeuralTools, o pngase en contacto con Palisade Corporation directamente llamando al +1-607-277-8000.

Lo que incluye el paquete


NeuralTools se puede comprar como producto independiente o como parte de las versiones Profesional o Industrial de DecisionTools Suite. El CD-ROM de NeuralTools contiene el programa auxiliar NeuralTools para Excel, varios ejemplos de NeuralTools y un sistema de ayuda electrnico con ndice completo para NeuralTools. Las versiones Profesional e Industrial de DecisionTools Suite contienen todo lo anterior, adems de aplicaciones adicionales.

Informacin sobre esta versin


Esta versin de NeuralTools se puede instalar como programa de 32-bit para Microsoft Excel 2000 o posterior.

Captulo 1: Introduccin

El sistema operativo
Esta gua para el uso del programa est diseada para usuarios que tienen un conocimiento general del sistema operativo Windows y de Excel. En particular, el usuario debe: Estar familiarizado con el uso del PC y del ratn. Estar familiarizado con trminos como iconos, hacer clic, hacer doble clic, men, ventana, comando y objeto. Comprender los conceptos bsicos de estructura de directorios y archivos.

Cmo obtener ayuda


Se ofrece asistencia tcnica gratuita a todos los usuarios registrados de NeuralTools con un plan actual de mantenimiento, o tambin se ofrece por un precio por incidente. Para asegurar que usted es un usuario registrado de NeuralTools, regstrese electrnicamente en http://www.palisade.com/support/register.asp. Si se pone en contacto con nosotros por telfono, tenga a mano el nmero de serie y la Gua para el Uso del programa. Le podremos asistir mejor si se encuentra delante del PC en el momento de llamar.
Antes de llamar

Antes de ponerse en contacto con el servicio de asistencia tcnica, repase la siguiente lista: Ha consultado la ayuda electrnica? Ha consultado esta Gua de Uso y revisado el tutorial multimedia electrnico? Ha ledo el archivo LEAME.WRI? Este archivo contiene informacin actual referente a NeuralTools que puede no estar en la gua del programa. Puede reproducir el problema consistentemente? Puede reproducir el problema en otro PC o con otro modelo? Ha visitado nuestra pgina de World Wide Web? La direccin es http://www.palisade.com. En nuestra pgina Web tambin podr encontrar las preguntas ms frecuentes (una base de datos de preguntas y respuestas sobre temas tcnicos) y una serie de archivos de reparacin de NeuralTools en la seccin de Asistencia Tcnica. Recomendamos que visite nuestra pgina Web con regularidad para obtener informacin actualizada sobre NeuralTools y sobre otros programas de Palisade.

Introduccin

Cmo ponerse en contacto con Palisade

Palisade Corporation est abierto a sus preguntas, comentarios y sugerencias referentes a NeuralTools. Pngase en contacto con nuestro personal de asistencia tcnica siguiendo uno de estos mtodos: Enve un correo electrnico a support@palisade.com. Llame al telfono +1-607-277-8000 los das laborables de 9:00 a.m. a 5:00 p.m., hora estndar del este de Estados Unidos. Para acceder al servicio de asistencia tcnica siga las indicaciones del sistema. Enve un fax al +1-607-277-8001 Enve una carta postal a: Asistencia Tcnica Palisade Corporation 798 Cascadilla St. Ithaca, NY 14850 EE.UU. Si quiere ponerse en contacto con Palisade en Europa. Enve correo electrnico a support@palisade-europe.com. Llame al telfono +44 1895425050 (Reino Unido). Enve un fax al +44 1895425051 (Reino Unido). Enve una carta postal a: Palisade Europe 31 The Green West Drayton Middlesex UB7 7PN Reino Unido Si quiere ponerse en contacto con Palisade en Asia-Pacfico. Enve correo electrnico a support@palisade.com.au. Llame al telfono +61 2 9252 5922 (Australia). Enve un fax al +61 2 9252 2820(Australia). Enve una carta postal a: Palisade Asia-Pacific Pty Limited Suite 404, Level 4 20 Loftus Street Sydney NSW 2000 Australia Independientemente del mtodo de contacto, mencione siempre el nombre del producto, la versin y el nmero de serie. La versin exacta se encuentra seleccionando el comando Acerca de de la Ayuda del men de NeuralTools en Excel.

Captulo 1: Introduccin

Versin para estudiantes

La versin para estudiantes de NeuralTools no incluye asistencia tcnica por telfono. Si necesita ayuda, recomendamos las siguientes alternativas: Consulte con su profesor o asistente. Vaya a http://www.palisade.com y busque entre las respuestas a las preguntas ms frecuentes. Pngase en contacto con nuestro departamento de asistencia tcnica enviando un fax o mensajes de correo electrnico.

Requisitos del sistema de NeuralTools


Los requisitos del sistema de NeuralTools 5.5 para Microsoft Excel para Windows son los siguientes: PC Pentium o superior con disco duro. Microsoft Windows 2000 SP4, Windows XP o superior. Microsoft Excel 2000 o posterior.

Introduccin

Instrucciones para la instalacin


Instrucciones generales de instalacin
El programa de instalacin copia los archivos del sistema de NeuralTools en el directorio seleccionado del disco duro. Para ejecutar el programa de instalacin en Windows 2000 o posterior: 1) Introduzca el CD-ROM de NeuralTools o de DecisionTools Suite en la unidad de CD-ROM 2) Haga clic en el botn Inicio, luego en Configuracin y luego en Panel de control 3) Haga doble clic sobre el icono Agregar/Quitar programas 4) En la seccin Instalar/Desinstalar, pulse el botn Instalar 5) Siga las instrucciones de instalacin que aparecen en la pantalla Si tiene algn problema instalando NeuralTools, compruebe que hay espacio suficiente en el disco en el que va a instalar el programa. Si falta espacio, libere el espacio de disco que sea necesario e intente instalar el programa de nuevo.
Cmo quitar NeuralTools de su PC

Si quiere quitar NeuralTools de su PC, use la utilidad Agregar/Quitar Programas del Panel de Control y seleccione NeuralTools.

Captulo 1: Introduccin

Configuracin de los iconos y de los accesos directos de NeuralTools


Creacin de los accesos directos en la barra de tareas de Windows

En Windows, el programa de instalacin crea automticamente un comando de NeuralTools en el men Programas\Palisade DecisionTools de la barra de herramientas. Pero si tiene algn problema durante la instalacin, o si desea hacerlo manualmente en otro momento, siga estas instrucciones: Recuerde que las instrucciones que se dan a continuacin son para Windows XP Professional. Las instrucciones para otros sistemas operativos pueden ser diferentes. 1) Haga clic en el botn Inicio y luego en Configuracin. 2) Haga clic en Barra de Tareas y Men Inicio, y luego haga clic en la pestaa Men Inicio. 3) Haga clic en Personalizar, haga clic en Aadir y luego en Examinar. 4) Localice el archivo NeuralTools.EXE, haga clic en el archivo y luego haga clic en Aceptar. 5) Haga clic en Siguiente y luego doble clic en el men en el que quiere que aparezca el programa. 6) Escriba el nombre NeuralTools y luego haga clic en Terminar. 7) Haga clic en Aceptar en todos los cuadros de dilogo.

Instrucciones para la instalacin

Los programas de DecisionTools Suite


NeuralTools forma parte de DecisionTools Suite, un juego de productos de anlisis de riesgo y decisin que ofrece Palisade Corporation. El procedimiento de instalacin predeterminado de NeuralTools coloca NeuralTools en un subdirectorio del directorio principal Archivos de programas\Palisade. Algo similar ocurre con Excel, que normalmente se instala como un subdirectorio del directorio Microsoft Office. Uno de los subdirectorios del directorio Archivos de programas\Palisade ser el directorio de NeuralTools (denominado de forma predeterminada NeuralTools5). Este directorio contiene el archivo del programa de complemento NeuralTools (NEURALTOOLS.XLA) adems de modelos de ejemplo y otros archivos necesarios para el funcionamiento de NeuralTools. Otro de los subdirectorios de Archivos de programas\Palisade es el directorio SYSTEM, que contiene archivos necesarios para todos los programas de DecisionTools Suite, incluyendo archivos comunes de ayuda y libreras de programas.

Captulo 1: Introduccin

10

Activacin del software


La activacin es un proceso que se realiza una sola vez para verificar la licencia y es necesario para que el software de NeuralTools funcione como un producto con licencia completa. En la factura impresa o enviada por correo electrnico encontrar un cdigo de activacin compuesto de una secuencia separada por guiones similar a esta: 19a0-c7c1-15ef-1be0-4d7f-cd. Si introduce el Cdigo de Activacin durante la instalacin, el software se activa la primera vez que ejecute el software y no ser necesaria accin adicional alguna. Si quiere activar el software despus de la instalacin, seleccione el comando Activacin de la Licencia del men Ayuda de NeuralTools e introduzca el cdigo de activacin en el cuadro de dilogo Activacin de la Licencia de Palisade que aparece en pantalla.

Preguntas ms frecuentes

1) Qu sucede si el software no se activa? Si no introduce un cdigo de activacin durante la instalacin o si instala una versin de prueba, el software funcionar como una versin de prueba con una limitacin de tiempo y/o nmero de usos y deber activarse con un cdigo de activacin para que funcione como un producto con licencia completa.

Captulo 1: Introduccin

11

2) Cunto tiempo puedo usar el producto antes de activarlo? El software que no se activa se puede usar durante quince das. Estarn presentes todas las funciones del producto, pero el cuadro de dilogo Activacin de Licencia aparecer cada vez que se inicie el programa para recordarle que lo active y para indicar el tiempo de uso restante. Si expira el periodo de prueba de 15 das, el software requerir la activacin para su uso. 3) Cmo puedo comprobar el estado de activacin? El cuadro de dilogo Activacin de Licencia se puede abrir con el comando Activacin de Licencia del men Ayuda de NeuralTools. El software activado muestra un estado de Activado y la versin de prueba muestra un estado de No activado. Si el software no est activado, aparecer el tiempo restante de funcionamiento del software. 4) Cmo puedo activar el software? Si no tiene un cdigo de activacin, puede obtenerlo haciendo clic en el botn Comprar del cuadro de dilogo Activacin de Licencia. Una compra electrnica recibir inmediatamente un cdigo de activacin y un enlace opcional para descargar el programa de instalacin por si fuera necesario reinstalar el programa. Para hacer una compra por telfono, llame a la oficina local de Palisade que aparece en la seccin Cmo ponerse en contacto con Palisade de este captulo. La activacin se puede hacer a travs de Internet o por correo electrnico: Activacin si tiene acceso a Internet En el cuadro de dilogo Activacin de Licencia de Palisade, escriba o pegue el cdigo de activacin y pulse Activacin automtica. Aparecer un mensaje de operacin satisfactoria despus de unos segundos y el cuadro de dilogo de Activacin de Licencia mostrar el estado de activacin del software.

12

Activacin del software

Activacin si no tiene acceso a Internet

La activacin automtica a travs de correo electrnico requiere varios pasos: 1. Haga clic en Activacin manual para abrir el archivo request.xml que podr guardar en el disco duro o copiar en el portapapeles de Windows. (Se recomienda que anote la ubicacin del archivo request.xml en su PC.) Copie o adjunte el archivo XML a un mensaje de correo electrnico y envelo a activation@palisade.com. Recibir pronto una respuesta automtica en la direccin de retorno de su correo electrnico. Guarde el archivo adjunto response.xml del mensaje de correo electrnico de respuesta en el disco duro. Haga clic n el botn Procesar que aparece ahora en el cuadro de dilogo de Activacin de Licencia de Palisade y navegue hasta el archivo response.xml. Seleccione el archivo y haga clic en Aceptar.

2.

3. 4.

Aparecer un mensaje de operacin satisfactoria y el cuadro de dilogo de Activacin de Licencia mostrar el estado de activacin del software. 5) Cmo puedo transferir la licencia de software a otra mquina? La transferencia de una licencia, o cambio de residencia, se puede hacer a travs del cuadro de dilogo de Activacin de Licencia de Palisade en un procedimiento de dos pasos: desactivacin en la primera mquina y activacin en la segunda mquina. El uso tpico de un cambio de residencia es la transferencia de la copia de NeuralTools de un PC de oficina a otro porttil. Para cambiar la residencia de la Mquina1 a la Mquina2, asegrese de que ambas mquinas tienen el software instalado y estn conectadas a Internet durante el proceso de desactivacin/activacin. 1. En la Mquina1, haga clic en Desctivacin automtica en el cuadro de dilogo de Activacin de Licencia. Espere a que aparezca el mensaje de operacin satisfactoria. En la Mquina2, haga clic en Activacin automtica. Espere a que aparezca el mensaje de operacin satisfactoria.

2.

Si las mquinas no tienen acceso a Internet, puede seguir instrucciones similares a las anteriores para el cambio de residencia mediante el proceso automtico por correo electrnico.
Captulo 1: Introduccin 13

6) Tengo acceso a Internet pero todava no puedo Activar/Desactivar automticamente. El sistema Firewall debe estar configurado para permitir el acceso TCP al servidor de licencias. Para usuarios individuales (no instalaciones de red) es http://service.palisade.com:8888 (TCP puerto 8888 en http://service.palisade.com).

14

Activacin del software

Captulo 2: Introduccin a NeuralTools


17

Introduccin

Para qu sirven las redes neuronales? ..............................................17 NeuralTools y las redes neuronales....................................................18 El men y la barra de herramientas de NeuralTools .......................19 Conjuntos de datos y el Administrador de conjunto de datos ......20 Tipos de variables.....................................................................21 Datos multi-rango.....................................................................21 Entrenamiento de una red neuronal ...................................................22 Combinacin de entrenamiento, prueba y prediccin ......22 Configuracin de red ...............................................................23 Previsualizacin de entrenamiento .......................................24 Proceso de entrenamiento .......................................................25 Informes de entrenamiento ....................................................26 Prueba de una red ..................................................................................27 Informes de prueba ..................................................................28 Prediccin ................................................................................................29 Resultados de la prediccin....................................................30 Prediccin en vivo ....................................................................30 Informes y grficas de NeuralTools ...................................................31 Utilidades de NeuralTools ...................................................................32 Uso de NeuralTools con StatTools, Solver y Evolver......................32

Captulo 2: Introduccin a NeuralTools

15

16

Introduccin
NeuralTools proporciona excelente capacidad para redes neuronales en el entorno familiar de Microsoft Excel. Los procedimientos de NeuralTools como la definicin de conjuntos de datos, el entrenamiento y las pruebas de redes neuronales y la prediccin de valores usando redes entrenadas se pueden ejecutar sobre los datos en Excel, y los informes y grficos de los anlisis se crean en Excel.

Para qu sirven las redes neuronales?


Las redes neuronales son capaces de aprender complejas relaciones de datos. Al imitar las funciones de un cerebro, pueden diferenciar patrones de datos y luego extrapolar predicciones cuando se introducen nuevos datos. Los problemas en los que se usan redes neuronales se pueden dividir en dos grupos generales: Problemas de clasificacin: Problemas en los que se trata de determinar el tipo de categora al que pertenece un elemento desconocido. Como ejemplo estn los diagnsticos mdicos o las predicciones de capacidad de pago de un crdito. Problema numricos: Situaciones en las que debe predecir un resultado numrico especfico. Como ejemplo estn la previsin del precio de acciones o la prediccin del nivel de ventas durante un periodo de tiempo futuro.

NeuralTools incluye ejemplos que muestran como aplicar redes neuronales a diferentes problemas de prediccin. La carpeta NeuralTools\Examples\Spanish contiene los ejemplos en formato de libro de trabajo de Excel.

Captulo 2: Introduccin a NeuralTools

17

NeuralTools y las redes neuronales


Cuando se usa NeuralTools, las redes neuronales se desarrollan y utilizan en cuatro pasos: Preparacin de datos Los datos que se usan en NeuralTools se definen en conjuntos de datos. El Administrador de conjunto de datos se usa para configurar los conjuntos de datos para que se puedan utilizar una y otra vez con las redes neuronales. Entrenamiento Con el entrenamiento se genera una red neuronal a partir de un conjunto de datos compuesto de casos con valores de salida conocidos. Estos datos son frecuentemente casos histricos de los cuales se conocen los valores de salida / variable dependiente. Prueba Con las pruebas se comprueba la red neuronal para ver cmo realiza la prediccin de los valores de salida conocidos. Los datos usados para las pruebas son normalmente un subconjunto de los datos histricos. Este subconjunto no se utilizan para el entrenamiento de la red. Despus de la prueba, se mide el funcionamiento de la red mediante estadsticas como el porcentaje de respuesta conocidas cuya prediccin ha sido correcta. Prediccin Se usa una red neuronal entrenada para predecir valores de salida desconocidos. Una vez entrenada y probada, la red se puede usar para predecir salidas de datos de casos nuevos.

El entrenamiento y las pruebas son un proceso interactivo que a veces consume gran cantidad de tiempo. Normalmente se hace el entrenamiento varias veces con diferentes configuraciones para generar una red neuronal que obtenga los mejores resultados en la prueba. Cuando tenga la mejor red podr usarla rpidamente para predecir. Ahora vamos a ver cmo funciona NeuralTools en Excel y como se definen conjuntos de datos y se entrenan y prueban redes neuronales usando esos conjuntos de datos. Luego, haremos predicciones valores de salida desconocidos usando redes entrenadas.

18

Introduccin

El men y la barra de herramientas de NeuralTools


Una vez instalado NeuralTools, su men y comandos se incluyen en la barra de mens de Excel en Excel 2003 o anteriores versiones. Tambin aparecer una barra de herramientas de NeuralTools. El men muestra los comandos para 1) definir datos en conjuntos de datos, 2) entrenar y probar redes neuronales y 3) hacer predicciones de valores usando las redes neuronales entrenadas. En Excel 2007, todos los comandos estn disponibles a travs de la cinta de NeuralTools.

Captulo 2: Introduccin a NeuralTools

19

Conjuntos de datos y el Administrador de conjunto de datos


Los datos en NeuralTools se estructuran en casos y variables. Se trabaja con un conjunto de datos, o un conjunto de variables estadsticas, que se encuentran en columnas contiguas con los nombres de las variables en la primera fila del conjunto de datos. Cada fila del conjunto de datos es un caso. Cada caso tiene un conjunto de valores de variable independiente y un valor conocido o que falta para la variable de salida dependiente. El trabajo de NeuralTools consiste en predecir los valores de variable de salida de los casos en los que no son conocidas. El Administrador de conjunto de datos de NeuralTools permite definir los conjuntos de datos y las variables. Luego podr usar estas variables predefinidas para entrenar y probar redes neuronales, sin tener que seleccionar una y otra vez los datos que desea analizar. Puede colocar todos los casos histricos conocidos en un conjunto de datos y los casos para los que desea predecir los resultados en otro conjunto de datos diferente. Tambin puede combinar todos los datos los datos histricos conocidos y los datos que desea predecir en un solo conjunto de datos.

20

Introduccin

Cada variable del conjunto de datos tiene asociado un nombre y un rango de celdas de Excel. Cada columna del rango contiene datos de una variable diferente. Un conjunto de datos puede incluir mltiples bloques de celdas, lo cual permite poner los datos en diferentes hojas de un mismo libro de trabajo. Cuando se definen conjuntos de datos, NeuralTools trata de identificar las variables en el bloque de celdas que rodean a la seleccin actual de Excel. Esto facilita la configuracin del conjunto de datos con nombres de variable en la fila superior y las variables distribuidas en columnas.
Tipos de variables

En NeuralTools, las variables pueden ser independientes o dependientes, y numricas o de categora (por ejemplo S o No, o Rojo, Verde o Azul). El Administrador de conjunto de datos trata de identificar el tipo de cada variable del conjunto de datos, pero puede sustituir los tipos por sus propias selecciones. En una sola columna de una hoja de clculo de Excel 2003 o anterior caben hasta 65,536 puntos de datos para una variable. Si las variables tienen ms valores y no quiere actualizar el programa a Excel 2007, NeuralTools permite asignar mltiples rangos de celdas a un solo conjunto de datos. Es decir, puede repetir un conjunto de datos ocupando mltiples hojas, asignando las mismas columnas a diferentes hojas de clculo para que quepan todos los valores del conjunto de datos.

Datos multi-rango

Captulo 2: Introduccin a NeuralTools

21

Entrenamiento de una red neuronal


Despus de definir el conjunto de datos que contiene los casos con valores histricos conocidos, puede entrenar una red neuronal usando esos datos. Hay diferentes opciones que determinan el tipo de red que generar NeuralTools. Dependiendo de la naturaleza de los datos, las diferentes opciones de red pueden generar redes entrenadas de mejor funcionamiento (es decir, redes que predicen respuestas mejor). El proceso de prueba que se realiza despus del entrenamiento ofrece una medida precisa del funcionamiento de la red entrenada a la hora de predecir valores de salida.

El entrenamiento de una red neuronal, as como la prueba y prediccin, requiere la especificacin de un conjunto de datos que contenga los datos que se van a usar durante el entrenamiento. NeuralTools puede guardar la red entrenada directamente en el libro de trabajo o en un archivo.
Combinacin de entrenamiento, prueba y prediccin

Si todos los datos se encuentran en un solo conjunto de datos (e incluyen los datos histricos conocidos y los nuevos datos de los que no conoce los valores de salida), NeuralTools permite entrenar y probar la red y luego predecir los valores de salida, todo en un solo paso. Se conserva un cierto porcentaje de los datos histricos para la prueba (20% es lo que se muestra en la pgina anterior) y luego se selecciona predecir automticamente los valores de salida de los casos a los que le faltan los valores dependientes. As puede obtener rpidamente las respuestas que necesita con una sola operacin.

22

Introduccin

Configuracin de red

NeuralTools respalda diferentes configuraciones de red neuronal para obtener las mejores predicciones posibles. Para la prediccin de clasificaciones /categoras (en las que la variable dependiente es de tipo categora), se ofrecen dos tipos de redes: Redes neuronales probabilsticas (PN) y Redes multinivel siempre hacia adelante (MLF). La prediccin numrica se puede realizar usando redes MLF, as como Redes neuronales de regresin generalizada (GRN), que estn estrechamente relacionadas con las redes PN.

NeuralTools facilita la seleccin de una configuracin de red al ofrecer una bsqueda de mejor red. Cuando se selecciona, NeuralTools entrena y prueba una serie de configuraciones de red neuronal para generar la que realiza mejores predicciones de los datos. La mejor configuracin se determina basndose en los datos de prueba, por lo tanto debe seleccionarse la opcin Probar automticamente en la pestaa Entrenamiento de la bsqueda de Mejor red.

Captulo 2: Introduccin a NeuralTools

23

Previsualizacin de entrenamiento

Una vez seleccionadas las opciones de entrenamiento y configuracin de red, NeuralTools previsualiza lo que har durante el entrenamiento de la red. Como el entrenamiento es el proceso que requiere ms tiempo en la modelacin de redes neuronales, conviene revisar la configuracin de entrenamiento antes de proceder. NeuralTools tratar de identificar cualquier problema que encuentre en los datos para que pueda corregirlo antes de que se realice el entrenamiento.

24

Introduccin

Proceso de entrenamiento

Cuando NeuralTools procede con el entrenamiento de la red neuronal con los datos, informa de funcionamiento del proceso. Normalmente, la red mejora cada vez ms segn evoluciona el entrenamiento, ya que NeuralTools genera redes que hacen mejores predicciones de los datos con menos errores. Los grficos se actualizan para mostrar el progreso de NeuralTools durante el entrenamiento.

El entrenamiento se detiene cuando se alcanza cualquiera de las condiciones de parada establecidas, como puede ser el tiempo mximo de entrenamiento. Si ha seleccionado probar automticamente la red o predecir los valores de salida que faltan en el conjunto de datos, esta operacin se realizar despus del entrenamiento.

Captulo 2: Introduccin a NeuralTools

25

Informes de entrenamiento

Los informes de entrenamiento muestran el buen funcionamiento de la red entrenada. Estadsticas como % de predicciones incorrectas muestran el nmero de casos del conjunto de entrenamiento para los que la red hizo una prediccin de un valor de salida que no coincide con el valor conocido.

26

Introduccin

Prueba de una red


Durante la prueba se comprueba la red neuronal entrenada para ver cmo realiza la prediccin de los valores de salida conocidos. Los datos de prueba son normalmente un subconjunto de los datos histricos con valores de salida conocidos. Este subconjunto no se utilizan para el entrenamiento de la red.

Cuando los datos de prueba estn en un conjunto de datos separado, NeuralTools empareja las variables del conjunto de datos de prueba con los datos de entrenamiento. Como sucede con el entrenamiento, NeuralTools previsualiza la configuracin de la prueba antes de realizarla.

Captulo 2: Introduccin a NeuralTools

27

Informes de prueba

La prueba (as como las predicciones) se ejecutan mucho ms rpido que el entrenamiento. NeuralTools informa del funcionamiento de la prediccin de las respuestas conocidas de los datos de prueba. Esto ayuda a ver si la red tendr un buen funcionamiento haciendo predicciones cuando se aplique a casos con valores de salida desconocidos.

28

Introduccin

Prediccin
El utilidad final de una red neuronal es la prediccin. La red entrenada se aplica a los nuevos casos de los que no se conocen los valores de salida, pero se quieren predecir. NeuralTools ofrece dos mtodos de prediccin: 1) un mtodo por comando para la prediccin de valores de los casos de un conjunto de datos, y 2) prediccin en vivo (slo en la versin Industrial), en el que los valores de las variables independientes de un caso de la hoja de clculo se pueden entrenar y NeuralTools calcula automticamente el valor de salida de la prediccin. Cuando se predicen valores para un grupo de casos de un conjunto de datos, el cuadro de dilogo Prediccin sirve para configurar el proceso de prediccin. Puede hacer la prediccin slo para los casos a los que le faltan valores de salida y activar la prediccin en vivo para hacer modificaciones en los datos para ver cmo afectan a las predicciones. Se pueden usar diferentes redes entrenadas para ver la diferencia entre los valores de la prediccin.

Como sucede con el entrenamiento y la prueba, NeuralTools primero previsualiza los datos y la configuracin que se usarn en la prediccin. Luego, las predicciones se envan a la hoja de clculo de Excel.

Captulo 2: Introduccin a NeuralTools

29

Resultados de la prediccin

Los valores de salida de la prediccin se muestran junto a los casos para los que se realiza la prediccin. En esta pantalla, los valores de la prediccin estn en color morado.

Prediccin en vivo

Cuando se activa la prediccin en vivo, NeuralTools aade automticamente una frmula de Excel a la celda en la que se muestra el valor de la prediccin. Esta frmula genera el valor de prediccin; por lo tanto, si cambia los valores de la variable independiente de un caso, el valor de la prediccin se recalcula automticamente. Usando la prediccin en vivo puede simplemente escribir los datos de los nuevos casos directamente en Excel y generar automticamente una nueva prediccin, sin tener que pasar por el cuadro de dilogo de Prediccin. Por ejemplo, si los valores de la variable independiente de un caso de la fila 7 de la hoja de clculo anterior se cambian como se muestra, el valor de la prediccin se actualiza automticamente. Como sucede con cualquier celda de una hoja de clculo, puede hacer referencia a una celda de prediccin en vivo en una frmula de Excel.

(Nota: La prediccin en vivo slo est disponible en la versin Industrial).

30

Introduccin

Informes y grficas de NeuralTools


NeuralTools crea informes de resumen y detallados del entrenamiento, la prueba y la prediccin. Los informes de resumen se muestran en sus propias hojas de clculo y contienen informacin general sobre la prueba o el entrenamiento. El informe detallado ofrece informacin caso por caso y se muestra junto a los datos para los que se genera el informe. Adems, la mayora de la informacin del informe de resumen se pueden encontrar en el Informe detallado como un comentario aadido a la celda de ttulo; esa versin del informe de resumen se conoce como resumen rpido.

Cada vez que NeuralTools crea una o ms grficas, las coloca con los informes. Las grficas se crean en formato de Excel y se pueden personalizar usando comandos de grficos estndar de Excel.

Captulo 2: Introduccin a NeuralTools

31

Utilidades de NeuralTools
Se proporcionan dos utilidades para administrar la modelacin con redes neuronales en NeuralTools. El Administrador de red neuronal permite copiar o mover redes neuronales entrenadas entre libros de trabajo o archivos. La utilidad de Datos que faltan sirve para identificar y corregir casos de los conjuntos de datos a los que le faltan datos.

Uso de NeuralTools con StatTools, Solver y Evolver


NeuralTools ha sido diseado para su uso con StatTools, el programa auxiliar estadstico para Excel de Palisade. Ambos productos comparten el mismo Administrador de conjunto de datos; los conjuntos de datos definidos en NeuralTools se pueden analizar en StatTools y viceversa. Con StatTools se pueden calcular estadsticas de las variables de los conjuntos de datos definidos en NeuralTools junto con las estadsticas de las predicciones generadas por NeuralTools. Los informes detallados generados en NeuralTools estn disponibles inmediatamente para su anlisis en StatTools; de hecho, aparecen automticamente en la lista de conjuntos de datos del Administrador de conjunto de datos de StatTools. Esto facilita el uso de StatTools para obtener resultados estadsticos adicionales a los que contienen los informes de resumen de NeuralTools. Por ejemplo, un informe de resumen de una prueba incluye un histograma de residuales (definido como las diferencias entre los valores reales y los de prediccin). Basndose en el histograma, los residuales pueden aparecer como aproximadamente distribuidos normalmente. Para probar la hiptesis de una distribucin normal, se puede aplicar una de las pruebas de normalidad de StatTools a la variable Residuales del Informe detallado. Se ofrece un ejemplo en el archivo Prediccin de edad de molusco con anlisis de StatTools.xls. La funcin de prediccin en vivo de NeuralTools facilita la visualizacin de el efecto de los cambios de los valores independientes sobre la prediccin. Con la prediccin en vivo, se pueden usar otras funciones disponibles en Excel para explorar la relacin entre las variables independientes y la dependiente.

32

Introduccin

Solver El programa optimizador incorporado de Excel se puede usar con la funcin de prediccin en vivo de NeuralTools para calcular los valores de la decisin ptima para las predicciones hechas con NeuralTools. El archivo Prstamos para autos con Solver.xls incluye un ejemplo. En este ejemplo, se usa una red neuronal para predecir si el solicitante de un prstamo har sus pagos a tiempo. Sin embargo, es posible que la red slo tenga un nivel de confianza del 60% en la respuesta. El Solver de Excel se puede usar para determinar una cantidad de prstamo para la que la red tenga una seguridad del 90% de que el individuo har sus pagos a tiempo. En este caso, el programa optimizador prueba diferentes cantidades de prstamo mientras NeuralTools actualiza automticamente el valor de probabilidad. Evolver, el programa optimizador basado en algoritmo gentico de Palisade, se puede usar en lugar del Solver para encontrar la respuesta. A diferencia del Solver, Evolver puede procesar problemas de optimizacin en los que hay ms de un valor ptimo local.

Captulo 2: Introduccin a NeuralTools

33

34

Captulo 3: Gua de referencia de NeuralTools


Introduccin Referencia: Iconos de NeuralTools 37 39

La barra de herramientas de NeuralTools......................................39 Referencia: Comandos del men de NeuralTools 41

Introduccin ......................................................................................41 Iconos de los cuadros de dilogo.........................................................42 Referencia de comandos .................................................................43 El comando Administrador de conjunto de datos............................43 El comando Entrenar .............................................................................50 El comando Probar .................................................................................64 El comando Predecir ..............................................................................71 Utilidades...........................................................................................77 El comando Configuraciones de aplicacin ......................................77 El comando Administrador de red neuronal.....................................81 El comando Utilidades de reemplazo de datos.................................83 Informacin adicional sobre redes neuronales 87

Captulo 3: Gua de referencia de NeuralTools

35

36

Introduccin
El captulo Gua de referencia de NeuralTools describe los iconos, comandos y funciones estadsticas que utiliza NeuralTools. Este captulo est dividido en dos secciones: 1) Referencia: Iconos de NeuralTools 2) Referencia: Comandos del men de NeuralTools

Captulo 3: Gua de referencia de NeuralTools

37

38

Referencia: Iconos de NeuralTools


La barra de herramientas de NeuralTools
Los iconos de NeuralTools se usan para definir conjuntos de datos con los casos y variables para luego crear y usar redes neuronales sobre esos datos. Los iconos de NeuralTools aparecen en la barra de herramientas de Excel (como barra de herramientas personalizada de Excel) en Excel 2003 y versiones anteriores y en una cinta en Excel 2007. Esta seccin describe brevemente cada icono, explicando las funciones que realizan y los comandos de men equivalentes. En Excel 2007, todos los comandos estn disponibles a travs de la cinta de NeuralTools. Los siguientes iconos aparecen en la barra de herramientas de NeuralTools en Excel 2003 y versiones anteriores y/o en los cuadros de dilogo de NeuralTools.

Icono

Funcin y comando equivalente


Define un conjunto de datos y variables, o edita y elimina conjuntos de datos o variables existentes Comando equivalente: Comando Administrador de conjunto de datos Entrena una red neuronal Comando equivalente: Comando Entrenar Prueba una red neuronal Comando equivalente: Comando Probar Predice valores usando una red entrenada Comando equivalente: Comando Predecir Ejecuta las utilidades para redes neuronales Comando equivalente: Comando Utilidades Muestra el archivo de ayuda de NeuralTools Comando equivalente: Comando Ayuda

Referencia: Iconos de NeuralTools

39

Los siguientes iconos aparecen en la cinta de NeuralTools en Excel 2007.

Icono

Funcin y comando equivalente


Define un conjunto de datos y variables, o edita y elimina conjuntos de datos o variables existentes Comando equivalente: Comando Administrador de conjunto de datos Entrena una red neuronal Comando equivalente: Comando Entrenar Prueba una red neuronal Comando equivalente: Comando Probar Predice valores usando una red entrenada Comando equivalente: Comando Predecir Ejecuta las utilidades para redes neuronales Comando equivalente: Comando Utilidades Muestra el archivo de ayuda de NeuralTools Comando equivalente: Comando Ayuda

40

Referencia: Comandos del men de NeuralTools


Introduccin
En esta seccin de la Gua de referencia de se describen con detalle los comandos de NeuralTools disponibles tal y como aparecen en el men o la cinta de NeuralTools de Excel. Los comandos se describen en el orden en que aparecen en el men, comenzando con el comando Administrador de conjunto de datos y siguiendo hacia abajo en el men. Los iconos de NeuralTools se pueden utilizar para ejecutar muchos de los comandos del programa. En la seccin Referencia: Iconos de NeuralTools de este captulo se indican los comandos equivalentes a los iconos de NeuralTools.

Referencia: Comandos del men de NeuralTools

41

Iconos de los cuadros de dilogo


Pueden aparecer hasta dos iconos el icono Ayuda y el icono Configuraciones de aplicacin en los cuadros de dilogo de NeuralTools. El icono Ayuda permite acceder rpidamente al tema de ayuda del cuadro de dilogo correspondiente. El icono Configuraciones de aplicacin abre el cuadro de dilogo Configuraciones de aplicacin en el que podr introducir o editar las configuraciones de los informes de NeuralTools, as como las configuraciones predeterminadas de Entrenamiento, Prediccin y Tiempo de ejecucin.

42

Introduccin

Referencia de comandos
El comando Administrador de conjunto de datos
Define conjuntos de datos y variables de NeuralTools, o edita y elimina conjuntos de datos o variables existentes El Administrador de conjunto de datos permite definir los conjuntos de datos con los casos y variables. Una vez definidos los conjuntos de datos, se pueden usar para entrenar, probar y hacer predicciones con las redes neuronales. El cuadro de dilogo Administrador de conjunto de datos permite aadir o quitar conjuntos de datos, poner nombre a un conjunto de datos, especificar el diseo de las variables de un conjunto de datos y poner nombre a las variables de un conjunto de datos.
Qu son conjuntos de datos y variables?

NeuralTools se estructura en casos y variables. Se trabaja con un conjunto de datos, o un conjunto de variables estadsticas, que se encuentran en columnas contiguas de una hoja de clculo de Excel con los nombres de las variables en la primera fila del conjunto de datos. Cada fila del conjunto de datos es un caso. Cada caso tiene un conjunto de valores de variable independiente y un valor conocido o que falta para la variable de salida dependiente. Cada variable del conjunto de datos tiene asociado un nombre y un rango de celdas de Excel. Un conjunto de datos puede incluir mltiples bloques de celdas, lo cual permite poner los datos en diferentes hojas de un mismo libro de trabajo. Cuando se definen conjuntos de datos, NeuralTools trata de identificar las variables en el bloque de celdas que rodean a la seleccin actual de Excel. Esto puede facilitar la configuracin del conjunto de datos con nombres de variable en la fila superior y las variables distribuidas en columnas.

Referencia: Comandos del men de NeuralTools

43

El cuadro de dilogo Administrador de conjunto de datos

Las opciones de Conjunto de datos del cuadro de dilogo Administrador de conjunto de datos son: Nuevo, Eliminar Aade un nuevo conjunto de datos o elimina uno existente. Nombre Especifica el nombre del conjunto de datos. Rango de Excel Especifica el Rango de Excel asociado con el conjunto de datos. Si se han asignado mltiples rangos de celda al conjunto de datos, esta opcin va precedida de la palabra Mltiple. Aplicar formato de celda Aade una cuadrcula y colores que identifican los conjuntos de datos. Mltiple Haga clic en el botn Mltiple en el cuadro de dilogo Administrador de conjunto de datos para abrir el cuadro de dilogo Selector de mltiples rangos. Este cuadro de dilogo permite la introduccin de los rangos de celda individuales que componen el conjunto de datos de mltiples rangos de celda.

44

Referencia de comandos

Importar Permite copiar tipos de variables a este conjunto de datos desde otro conjunto de datos o red neuronal entrenada. El cuadro de dilogo Importar tipos de variables permite seleccionar la ubicacin y la red a usar para las definiciones de variables.

Conjuntos de datos de rangos mltiples

NeuralTools permite asignar mltiples rangos de celda de diferentes hojas de clculo a un solo conjunto de datos. Se puede usar un conjunto de datos de mltiples rangos cuando: 1) Cada variable del conjunto de datos tiene ms de 65,536 puntos de datos en Excel 2003 o versiones anteriores, lo cual requiere que el conjunto de datos se extienda a mltiples hojas de clculo de un mismo libro de trabajo, 2) Los datos de una variable se encuentran en mltiples bloques dispersos por las hojas de clculo del libro de trabajo. Nota: Un conjunto de datos de mltiples rangos no se puede definir dentro de una sola hoja de clculo. Se pueden definir en mltiples hojas de clculo dentro de un mismo libro de trabajo.

Referencia: Comandos del men de NeuralTools

45

Las opciones del cuadro de dilogo Definicin de conjunto de datos de rango mltiple son: Borra todo Borra todos los rangos introducidos. Llenar auto Aplica el primer rango introducido (en la fila 1) a todas las hojas de clculo visibles del libro de trabajo activo, e introduce estas referencias de NombreDeHoja!RangoDeCeldas en la cuadrcula Seleccionar Muestra un selector para destacar el bloque de celdas que se usar como Rango del Conjunto de datos. Los rangos secundarios tienen nombres de variables en la primera columna (fila) Los conjuntos de datos de mltiples rangos pueden tener nombres de variables identificando cada columna de cada rango incluido en el cuadro de dilogo, o nombres de variables identificando las columnas slo en el primer rango seleccionado. El primer rango seleccionado es el rango introducido en la fila 1 del cuadro de dilogo Definicin de conjunto de datos de rango mltiple.

46

Referencia de comandos

Opciones de variables

Cada fila de la cuadrcula del cuadro de dilogo Administrador de conjunto de datos incluye las variables del conjunto de datos, incluyendo el Rango de datos de Excel que contiene los puntos de datos de una variable, el Nombre de variable y el Tipo de variable.

Las opciones de Tipo de variable son: Categora dependiente Variable dependiente o de salida cuyos valores posibles se toman de un conjunto de posibles categoras; por ejemplo S o No, o Rojo, Verde o Azul. Numrica dependiente Variable dependiente o de salida cuyos posibles valores son numricos. Categora independiente Variable independiente cuyos valores posibles se toman de un conjunto de posibles categoras; por ejemplo S o No, o Rojo, Verde o Azul. Numrica independiente Variable independiente cuyos posibles valores son numricos. Etiqueta Una variable cuyos posibles valores son entrenar, probar o predecir. Este tipo de variable se usa para identificar casos de un conjunto de datos que se usarn para entrenamiento, prueba o prediccin. Sin usar Una variable de un conjunto de datos que no se usar en la red neuronal.
47

Referencia: Comandos del men de NeuralTools

Informacin adicional sobre las variables de Etiqueta

Las variables de Etiqueta son un tipo especial de variables de la base de datos de NeuralTools que se usan para marcar los casos de un conjunto de datos que se usarn para entrenamiento, prueba o prediccin. Son especialmente tiles si quiere incluir todos los datos (que se usarn en el entrenamiento, prueba y prediccin de una red) sean de un solo conjunto de datos. Cuando hay una variable de etiqueta, NeuralTools selecciona los casos que se van a usar para entrenamiento, prueba o prediccin, segn el valor de la variable de etiqueta. Al cambiar los valores de la variable de etiqueta se puede entrenar de nuevo una red usando diferentes casos y ver cmo cambia el funcionamiento de una red. Tambin puede aadir nuevos casos con valores de variable dependiente desconocidos a un conjunto de datos y asignar su prediccin con la etiqueta Predecir. La variable de Etiqueta slo puede tomar tres valores diferentes: Entrenar Especifica que el caso se usar para entrenamiento Probar Especifica que el caso se usar para probar Predecir Especifica que el caso se usar para predecir Nota: Si tiene una variable de etiqueta en el conjunto de datos, cambiarn las opciones del cuadro de dilogo Entrenar. Para obtener ms informacin, consulte el comando Entrenar.

48

Referencia de comandos

Capacidad de conjuntos de datos y variables

En una sola sesin, NeuralTools permite usar: Hasta 256 conjuntos de datos, ubicados en un solo libro de trabajo. Hasta 16384 variables por conjunto de datos en Excel 2007 (256 variables en versiones anteriores de Excel). Todos los datos de un solo conjunto de datos deben estar en el mismo libro de trabajo. El nmero de puntos de datos por variable y de casos por conjunto de datos slo est limitado por la memoria disponible en Excel 2007 (16,777,216 puntos de datos en versiones anteriores de Excel). Las capacidades reales de datos pueden ser menores que las indicadas dependiendo de la configuracin del sistema y de la versin de Excel que utilice. La capacidad de datos tambin se puede ver afectada por las limitaciones de memoria del propio Excel. Nota: El cuadro de dilogo Administrador de conjunto de datos indica todos los conjuntos de datos y variables del libro de trabajo activo (es decir, del libro de trabajo que se indica en el nombre del cuadro de dilogo Administrador de conjunto de datos). Para ver conjuntos de datos de otros libros de trabajo, active el libro de trabajo deseado en Excel y abra el cuadro de dilogo Administrador de conjunto de datos.

Referencia: Comandos del men de NeuralTools

49

El comando Entrenar
Especifica las configuraciones para el entrenamiento de una red neuronal y ejecuta el entrenamiento El comando Entrenar permite 1) especificar las configuraciones que se van a usar para el entrenamiento de una red neuronal en NeuralTools y 2) inicia el entrenamiento de una red.

La pestaa Entrenar

La pestaa Entrenar del cuadro de dilogo Entrenamiento especifica las opciones generales de entrenamiento de una red neuronal. Esto incluye lo siguiente: Conjunto de datos Muestra el conjunto de datos que se va a usar para entrenar la red neuronal. Este conjunto de datos debe definirse usando el Administrador de conjunto de datos y debe estar presente en la hoja activa. Guardar red como Especifica el nombre y la ubicacin de las redes neuronales entrenadas. Las redes neuronales se pueden guardar en un libro de trabajo de Excel o en un archivo del disco. Haga clic en Buscar para cambiar el nombre o la ubicacin.

50

Referencia de comandos

Tambin puede introducir un nombre y una descripcin para la red neuronal guardada. Las opciones Cuando el entrenamiento se complete permiten probar y predecir automticamente usando la red entrenada despus del entrenamiento. Esto se puede hacer cuando los datos de la prueba y prediccin se encuentran en el mismo conjunto de datos que los datos de entrenamiento. Probar automticamente Especifica que: 1) un % de casos del conjunto de datos que se apartarn automticamente del entrenamiento para su posterior uso en la prueba los casos en los que la variable Etiqueta = probar se usarn para la prueba. Las variables de Etiqueta son un tipo de variable especificado en el Administrador de conjunto de datos.

2)

Predecir automticamente los valores dependientes que faltan Especifica que la red entrenada se usar para predecir valores de variable dependiente de: 1) 2) casos en los que falta el valor de la variable dependiente, o casos en los que la variable Etiqueta = predecir. Las variables de Etiqueta son un tipo de variable especificado en el Administrador de conjunto de datos.

Referencia: Comandos del men de NeuralTools

51

Activar prediccin en vivo Especifica que NeuralTools colocar frmulas en las celdas en las que aparecen los valores de la prediccin de la variable dependiente para calcular los valores de la prediccin. Para obtener ms informacin sobre la prediccin en vivo, consulte el comando Predecir en este mismo captulo. Calcular impactos de variable Especifica que NeuralTools calcule el impacto relativo de cada variable independiente del conjunto de datos de entrenamiento al determinar las predicciones calculadas por la red.

Qu es un anlisis de impacto de una variable?

El propsito de un anlisis de Impacto de variable es medir la sensibilidad de las predicciones de la red al cambio de las variables independientes. Este anlisis slo se hace en los datos de entrenamiento. Como resultado del anlisis, se asigna a cada variable independiente un valor Impacto relativo de variable; es decir, valores porcentuales que suman el 100%. Cuanto ms bajo sea el valor del porcentaje, menos efecto tendr la variable sobre las predicciones. Los resultados del anlisis pueden ayudar a seleccionar un nuevo conjunto de variables independientes que haga predicciones ms exactas. Por ejemplo, una variable con un valor de impacto bajo se puede sustituir por alguna otra nueva variable. Sin embargo, debe recordarse que los resultados del Anlisis de impacto son relativos a una red determinada. El hecho de que una red haya aprendido a descartar una variable determinada hace ms probable que otra red tambin aprenda a descartarla, si bien otra sesin de entrenamiento con un tipo diferente de red podra descubrir que la variable puede contribuir significativamente a la exactitud de las predicciones. En los conjuntos de datos con nmeros reducidos de casos y /o nmeros elevados de variables, las diferencias del impacto relativo de las variables entre redes entrenadas pueden ser ms pronunciadas. Adems, es importante recordar que estos valores son relativos. Supongamos que con dos variables independientes, a una se le asigna un 99% y a otra un 1%. Esto significa que la segunda es mucho menos importante que la primera, pero no quiere decir que no sea importante, especialmente si se desea un alto nivel de precisin de las predicciones.

52

Referencia de comandos

Los siguientes son cuestiones adicionales que conviene recordar sobre el Anlisis de impacto de variable: 1) Slo se incluye en el anlisis el conjunto de datos de entrenamiento. (Si se usa Auto-Prueba o Auto-Prediccin, esos casos no se incluyen. La motivo es que pueden tener valores numricos fuera del rango de entrenamiento, lo cual puede generar resultados de anlisis ms impredecibles). 2) En el caso de variables independientes de categora, el anlisis procesa todas las categoras vlidas de esa variable en cada caso, y mide el cambio en el valor de prediccin. (En las predicciones de categora no hay valores numricos de prediccin, pero hay salidas numricas de red en las que se basa la prediccin de categora; el anlisis usa esas salidas numricas). 3) En el caso de una variable independiente numrica, el anlisis procesa en cada caso el rango del valor de entrenamiento del mnimo al mximo, midiendo el cambio del valor de prediccin (o, en el caso de una prediccin de categora, el cambio de las salidas numricas). El propsito del Anlisis de impacto de variable no es el respaldo de conclusiones firmes, como la afirmacin con un alto nivel de confianza de que una variable es irrelevante. Ms bien sirve para ayudar a buscar el mejor conjunto de variables independientes: los resultados del anlisis pueden indicar que una variable determinada parece suficientemente irrelevante como para que valga la pena intentar entrenar una red sin esta variable.

Referencia: Comandos del men de NeuralTools

53

Los resultados del Anlisis de impacto de variable se muestran en el informe Resumen de entrenamiento:

54

Referencia de comandos

La pestaa Configuracin de red

La pestaa Configuracin de red del cuadro de dilogo Entrenamiento permite seleccionar el tipo de red neuronal que se entrenar con los datos. Puede seleccionar una configuracin de red especfica o seleccionar una bsqueda de Mejor red en la que NeuralTools probar diferentes configuraciones posibles para identificar la que mejor funcionamiento tenga. NeuralTools respalda diferentes configuraciones de red neuronal para obtener las mejores predicciones posibles. Par la prediccin de clasificacin /categora, hay disponibles dos tipos de redes: Redes neuronales probabilsticas (PN) y Redes multinivel siempre hacia adelante (MLF). La prediccin numrica se puede realizar usando redes MLF, as como Redes neuronales de regresin generalizada (GRN), que estn estrechamente relacionadas con las redes PN. Para obtener ms informacin sobre los aspectos tcnicos de las configuraciones de red disponibles, consulte la seccin Informacin adicional sobre redes neuronales.

Referencia: Comandos del men de NeuralTools

55

La pestaa Configuracin de red incluye lo siguiente: Tipo de red Selecciona el tipo de red que se usar en el entrenamiento o la bsqueda de la Mejor red. Las Opciones de la pestaa Configuracin de red cambian dependiendo del tipo de red seleccionado. Los tipos de redes disponibles son: 1) Bsqueda de mejor red. En la Bsqueda de mejor red, NeuralTools prueba todas las configuraciones de red marcadas, incluyendo las redes PN/GRN y MLF con cuentas de nodos dentro del rango mnimo-mximo introducido. La configuracin que tenga mejor funcionamiento para los datos se identifica basndose en el error obtenido en los datos de la prueba. Si selecciona Almacenar todas las redes de prueba en un libro de trabajo nuevo, podr cargar individualmente cada una de las redes probadas (independientemente de si fue la red con mejor funcionamiento) del libro de trabajo y usarla para hacer una prediccin despus de completar el entrenamiento; tambin hay disponible un Informe de resumen completo para cada red. Red PN/GRN. Estos tipos de redes no requieren la seleccin de opciones adicionales para el entrenamiento; por esta razn esta configuracin es la predeterminada cuando se instala NeuralTools. Si los datos tienen valores de salida numricos, se entrenar una red GRN, y si los datos tienen valores de salida de categora se entrenar una red PN.

2)

56

Referencia de comandos

3)

Red MLF. Las Redes multinivel siempre hacia adelante (MLF) tienen uno o dos niveles de nodos ocultos.

Si selecciona cero nodos para el segundo nivel, ste se eliminar. La forma ms fiable de encontrar la mejor configuracin de una red MLF es usar la opcin Bsqueda de mejor red en lugar de la opcin de entrenar una sola red MLF. Si no hay tiempo suficiente para una Bsqueda de mejor Red, se recomienda que los valores Nmero de nodos se dejen en Automtico.
La pestaa Tiempo de ejecucin

La pestaa Tiempo de ejecucin del cuadro de dilogo Entrenamiento permite introducir condiciones de parada del entrenamiento. Si no selecciona ninguna condicin de parada, el entrenamiento acabar detenindose; el periodo de tiempo ser relativamente corto para las redes PN/GRN, y mucho ms largo para las redes MLF. Un posible mtodo es no seleccionar condiciones de parada y hacer clic en el botn Parar del cuadro de dilogo de progreso del entrenamiento cuando no tenga ms tiempo para entrenamiento. Con la Bsqueda de mejor red se debe definir un lmite de tiempo para el entrenamiento de una sola red, para asegurar que el algoritmo de bsqueda no dedica demasiado tiempo a una configuracin determinada. Las tres condiciones de parada disponibles se pueden combinar para especificar que NeuralTools pare cuando se cumpla cualquiera de las condiciones.

Referencia: Comandos del men de NeuralTools

57

Las opciones de Tiempo de ejecucin de entrenamiento son: Tiempo Especifica un lmite fijo de tiempo para el entrenamiento de una sola red. El entrenamiento se puede parar antes del periodo especificado, en cuanto el algoritmo determina que es poco probable seguir progresando. Si usa una bsqueda de Mejor red, cada configuracin de red probada se entrenar durante el tiempo introducido. Pruebas Especifica que NeuralTools no ejecutar ms de un nmero especificado de pruebas antes de parar. Con las Redes multinivel siempre hacia adelante, una prueba es una sola asignacin de pesos a las conexiones entre neuronas; el entrenamiento consiste en una bsqueda inteligente de pesos que generen las mejores predicciones. Con las Redes neuronales probabilsticas y las Redes neuronales de regresin generalizada, una prueba es una asignacin de factores de suavizacin para las variables. El entrenamiento consiste en una bsqueda de los mejores factores de suavizacin. Progreso Especifica que NeuralTools parar si no puede mejorar la estadstica de error al menos el porcentaje introducido dentro de un tiempo especificado.

58

Referencia de comandos

Cuadro de dilogo Previsualizacin de entrenamiento

El cuadro de dilogo Previsualizacin de entrenamiento muestra la configuracin del entrenamiento actual de la red junto con cualquier error detectado en los datos, antes de iniciarse el entrenamiento. Examinando el contenido de este cuadro de dilogo podr ver todas las presuposiciones de entrenamiento seleccionadas segn estn en NeuralTools. La seccin Errores y advertencias ofrece una descripcin de cualquier problema detectado por NeuralTools en los datos o en las configuraciones, que podr corregir si fuera necesario antes de dedicar tiempo al entrenamiento.

Referencia: Comandos del men de NeuralTools

59

La ventana de progreso del entrenamiento

La ventana de progreso del entrenamiento informa del estado de entrenamiento de la red durante su ejecucin. Los grficos detallan el funcionamiento de NeuralTools durante la mejora de la red y la reduccin de los errores generados. La ventana de progreso del entrenamiento informa de los errores en los datos de entrenamiento. La observacin de cambios en este valor no debe llevar a ninguna conclusin sobre la calidad de las predicciones que la red har de los casos no utilizados en el entrenamiento. Las conclusiones deben basarse en el error obtenido en los datos de entrenamiento. Adems, recuerde que con predicciones numricas, el error que aparece en la ventana de progreso es el error cuadrtico medio basado en datos a escala (consulte la informacin sobre escala en la seccin Transformacin de entradas). En las predicciones de categora, el error que aparece es una representacin numrica de los datos de categora.

60

Referencia de comandos

Informes de entrenamiento

Despus del entrenamiento se pueden crear informes de resumen y detallados. Estos informes detallan el funcionamiento de la red neuronal entrenada. El contenido de los informes generados se especifica en el cuadro de dilogo Configuraciones de aplicacin, en las configuraciones Informes a generar y Columnas en los informes detallados. Informe de resumen de entrenamiento El informe de resumen de entrenamiento ofrece estadsticas y grficos sobre el funcionamiento de la red neuronal entrenada.

Referencia: Comandos del men de NeuralTools

61

En la prediccin de categora/clasificacin, las estadsticas y grficas clave del informe de resumen de entrenamiento son las siguientes: 1) % de predicciones incorrectas El porcentaje de casos para los que la categora de la prediccin no coincide con la categora real. Probabilidad incorrecta media (slo disponible para las redes PN) NeuralTools calcula la Probabilidad de categoras incorrectas en cada caso, que es la suma de las probabilidades asignadas por la red PN a categoras incorrectas. Por ejemplo, si en un caso determinado la red asigna un 30% de probabilidad al rojo, un 20% al amarillo y un 50% al verde, y sabemos que la respuesta correcta es rojo, entonces el valor para ese caso es 20% + 50% = 70%. Este valor proporciona una medida de error caso por caso para la prediccin de categora, correspondiente al Error residual en la prediccin numrica. La Probabilidad incorrecta media es el valor de error promedio de todos los casos. Los informes detallados muestran la Probabilidad Incorrecta caso por caso, y para comprender mejor el concepto puede cambiar las configuraciones del Informe detallado para mostrar las probabilidades asignadas por la Red neuronal probabilstica a cada posible categora de la variable dependiente. Para hacerlo, seleccione Configuraciones de aplicacin en el men Utilidades y haga clic en el men desplegable situado a la derecha de la fila Columnas en los informes detallados. Aparecer el cuadro de dilogo NeuralTools Columnas a mostrar en los informes detallados. En ese cuadro de dilogo seleccione Probabilidades de todas las categoras (para PN) para la Prueba. Luego, entrene la red PN con el conjunto de datos con al menos 3 categoras en la variable dependiente (puede usar el archivo de ejemplo Prstamos para autos.xls) con la opcin Probar automticamente seleccionada. En el informe detallado resultante, observe la relacin entre los valores de la columna % Incorrecto y las probabilidades asignadas a cada posible categora; el % Incorrecto es la suma de las probabilidades de todas las categoras incorrectas. 3) Matriz de clasificacin Compara las categoras reales y las de prediccin por cada categora. Por ejemplo, la matriz de clasificacin puede revelar que la red detecta correctamente una condicin mdica en pacientes que la tienen, pero tiene cierta tendencia a levantar falsas alarmas en pacientes sanos.
Referencia de comandos

2)

62

4)

Impactos de variable Cuando se selecciona, muestra el impacto relativo de las variables independientes sobre las respuesta de la prediccin. Histograma de probabilidad de categoras incorrectas (slo disponible en las redes PN) Consulte el punto anterior Probabilidad incorrecta media para ver la explicacin de la Probabilidad de categoras incorrectas.

5)

En la prediccin numrica, las estadsticas y grficas clave del informe de resumen de entrenamiento son las siguientes: 1) % de predicciones incorrectas Una prediccin cuenta como incorrecta si se encuentra fuera del margen definido alrededor del valor; el ancho del margen se define en la configuracin Tolerancia correcta / incorrecta (entrenamiento) del cuadro de dilogo Configuraciones de aplicacin. Error cuadrtico medio Una medida de desviacin de las predicciones con respecto al valor (calculado como la raz cuadrada de la desviacin promedio al cuadrado). Error absoluto medio Desviacin promedio de las predicciones con respecto a los valores. Impactos de variable Cuando se selecciona, muestra el impacto relativo de las variables independientes sobre las respuesta de la prediccin. Histograma de residuales Residual es la diferencia que hay entre el valor real y el de la prediccin. Diagramas de dispersin que muestran las relaciones entre los valores reales, los valores de prediccin y los residuales.

2)

3) 4)

5) 6)

Referencia: Comandos del men de NeuralTools

63

El comando Probar
Especifica las configuraciones para la prueba de una red neuronal entrenada y ejecuta la prueba El comando Probar permite 1) especificar las configuraciones que se van a usar para la prueba de una red neuronal entrenada e 2) iniciar la prueba.

Los datos de la prueba son normalmente los datos con valores de salida conocidos que no se usaron en el entrenamiento de la red. Las opciones del cuadro de dilogo Probar son: Conjunto de datos Muestra el conjunto de datos que se va a usar para probar la red neuronal entrenada. Este conjunto de datos debe definirse usando el Administrador de conjunto de datos y debe estar presente en la hoja de clculo activa. Red a usar Especifica el nombre y la ubicacin de la red neuronal que se va a probar. Las redes neuronales se pueden guardar en un libro de trabajo de Excel o en un archivo del disco. Haga clic en Buscar para cambiar el nombre o la ubicacin.

64

Referencia de comandos

Asignacin de variables

Asignacin de variables Especifica cmo se emparejarn las variables del conjunto de datos que se va a probar con las variables del conjunto de datos que se us para el entrenamiento de la red.

Para la asignacin de variables hay dos opciones: 1) Asignacin automtica. Los nombres de variables de los datos de prueba se asignan segn el nombre con los del conjunto de datos de la red entrenada, y los tipos de variable se establecen basndose en esta asignacin Asignacin personalizada. La asignacin personalizada permite establecer individualmente la asignacin de variables del conjunto de datos de prueba con las del conjunto de datos de la red entrenada. Esto se hace cuando los nombres de las variables son diferentes en dos conjuntos de datos o cuando se desea hacer asignaciones diferentes.

2)

El cuadro de dilogo Asignacin de variables contiene los nombres de las variables de cada conjunto de datos para facilitar su asignacin. Slo se pueden emparejar variables de un mismo tipo. Cada vez que se hace un emparejamiento, las asignaciones realizadas se guardan con el conjunto de datos. Haciendo clic en Cargar asignacin anterior, puede ver todas las asignaciones hechas anteriormente y acceder a una serie de asignaciones anteriores para el conjunto de datos.
Referencia: Comandos del men de NeuralTools 65

Cuadro de dilogo Previsualizacin de prueba

El cuadro de dilogo Previsualizacin de prueba muestra la configuracin de la prueba actual de la red junto con cualquier error detectado en los datos, antes de iniciarse la prueba. Examinando el contenido de este cuadro de dilogo podr ver todas las presuposiciones de la prueba seleccionadas segn estn en NeuralTools. La seccin Errores y advertencias ofrece una descripcin de cualquier problema detectado por NeuralTools en los datos que podr corregir si fuera necesario antes de hacer la prueba.

66

Referencia de comandos

Informes de prueba

Despus de la prueba se pueden crear informes de resumen y detallados. Estos informes detallan el funcionamiento de la red neuronal entrenada con el conjunto de datos de prueba. El contenido de los informes generados se especifica en el cuadro de dilogo Configuraciones de aplicacin, en las configuraciones Informes a generar y Columnas en los informes detallados. El informe detallado resulta especialmente til con la prueba, ya que muestra el funcionamiento de la red entrenada a la hora de predecir valores de salida individuales del conjunto de datos de prueba. Informe de resumen de prueba El informe de resumen de prueba ofrece estadsticas y grficos sobre el funcionamiento de la red neuronal entrenada con el conjunto de datos de prueba.

Referencia: Comandos del men de NeuralTools

67

En la prediccin de categora, las estadsticas y grficas clave del informe de resumen de prueba son las siguientes: 1) % de predicciones incorrectas El porcentaje de casos para los que la categora de la prediccin no coincide con la categora real. Probabilidad incorrecta media (slo disponible para las redes PN) NeuralTools calcula la Probabilidad de categoras incorrectas en cada caso, que es la suma de las probabilidades asignadas por la red PN a categoras incorrectas. Por ejemplo, si en un caso determinado la red asigna un 30% de probabilidad al rojo, un 20% al amarillo y un 50% al verde, y sabemos que la respuesta correcta es rojo, entonces el valor para ese caso es 20% + 50% = 70%. Este valor proporciona una medida de error caso por caso para la prediccin de categora, correspondiente al Error residual en la prediccin numrica. La Probabilidad incorrecta media es el valor de error promedio de todos los casos. Los informes detallados muestran la Probabilidad Incorrecta caso por caso, y para comprender mejor el concepto puede cambiar las configuraciones del Informe detallado para mostrar las probabilidades asignadas por la Red neuronal probabilstica a cada posible categora de la variable dependiente. Para hacerlo, seleccione Configuraciones de aplicacin en el men Utilidades y haga clic en el men desplegable situado a la derecha de la fila Columnas en los informes detallados. Aparecer el cuadro de dilogo NeuralTools Columnas a mostrar en los informes detallados. En ese cuadro de dilogo seleccione Probabilidades de todas las categoras (para PN) para la Prueba. Luego, entrene la red PN con el conjunto de datos con al menos 3 categoras en la variable dependiente (puede usar el archivo de ejemplo Prstamos para autos.xls) con la opcin Probar automticamente seleccionada. En el Informe detallado resultante, observe la relacin entre los valores de la columna % Incorrecto y las probabilidades asignadas a cada posible categora; el % Incorrecto es la suma de las probabilidades de todas las categoras incorrectas. 3) Matriz de clasificacin Compara las categoras reales y las de prediccin por cada categora. Por ejemplo, la matriz de clasificacin puede revelar que la red detecta correctamente una condicin mdica en pacientes que la tienen, pero tiene cierta tendencia a levantar falsas alarmas en pacientes sanos.
Referencia de comandos

2)

68

4)

Histograma de probabilidad de categoras incorrectas (slo disponible en las redes PN) Consulte el punto anterior Probabilidad incorrecta media para ver la explicacin de la Probabilidad de categoras incorrectas.

En la prediccin numrica, las estadsticas y grficas clave del informe de resumen de prueba son las siguientes: 1) % de predicciones incorrectas Una prediccin cuenta como incorrecta si se encuentra fuera del margen definido alrededor del valor; el ancho del margen se define en la configuracin Tolerancia correcta / incorrecta (prueba) del cuadro de dilogo Configuraciones de aplicacin. Error cuadrtico medio Una medida de desviacin de las predicciones con respecto al valor (calculado como la raz cuadrada de la desviacin promedio al cuadrado). Error absoluto medio Desviacin promedio de las predicciones con respecto a los valores. Histograma de residuales Residual es la diferencia que hay entre el valor real y el de la prediccin. Diagramas de dispersin que muestran las relaciones entre los valores reales, los valores de prediccin y los residuales.

2)

3) 4) 5)

Informe detallado de prueba. Este informe se coloca junto al conjunto de datos de prueba y muestra el funcionamiento de la red entrenada a la hora de predecir valores de salida individuales del conjunto de datos de prueba.

Referencia: Comandos del men de NeuralTools

69

En el informe detallado de prueba, las predicciones se marcan como Correctas o Incorrectas basndose en el nivel de tolerancia establecido en el cuadro de dilogo Configuraciones de aplicacin. Si ejecuta mltiples pruebas, los Informes Detallados se pueden aadir en nuevas columnas a la derecha del conjunto de datos de prueba, para que pueda ver cmo cambian las predicciones en cada caso individual por cada prueba de las nuevas redes entrenadas.
Resmenes rpidos de los informes detallados

Mientras examina el Informe detallado, puede acceder rpidamente a la informacin del Informe de resumen mediante un comentario desplegable que aparece en Excel. Slo tiene que pasar el ratn sobre el encabezamiento del informe para que aparezca el comentario desplegable. Nota: Para que los comentarios desplegables aparezcan, la funcin de comentarios debe activarse en la pestaa Visualizacin de Excel.

70

Referencia de comandos

El comando Predecir
Especifica las configuraciones de los valores de la prediccin realizada con una red neuronal entrenada y ejecuta la prediccin El comando Predecir permite 1) especificar las configuraciones que se van a usar para la prediccin con una red neuronal entrenada y 2) ejecutar la prediccin.

Los datos a predecir normalmente son casos con valores de variable dependiente desconocidos. Las opciones del cuadro de dilogo Prediccin son: Conjunto de datos Muestra el conjunto de datos que se va a usar para la prediccin. Este conjunto de datos debe definirse usando el Administrador de conjunto de datos y debe estar presente en la hoja de clculo activa. Red a usar Especifica el nombre y la ubicacin de la red neuronal que se va a usar para la prediccin. Las redes neuronales se pueden guardar en un libro de trabajo de Excel o en un archivo del disco. Haga clic en Buscar para cambiar el nombre o la ubicacin. Asignacin de variables Especifica cmo se emparejarn las variables del conjunto de datos de prediccin con las variables del conjunto de datos que se us para el entrenamiento de la red. Haga clic en Editar para cambiar la asignacin de variables. Para obtener ms informacin

Referencia: Comandos del men de NeuralTools

71

sobre la Asignacin de variables, consulte el comando Probar en este mismo captulo. Predecir para Seleccione los casos para los que se va a hacer la prediccin. Normalmente se selecciona la prediccin de Casos con valores dependientes que faltan, pero si lo desea puede hacer predicciones de Todos los casos (incluso aquellos en los que el valor de la variable dependiente es conocido). Si tiene una variable de Etiqueta en el conjunto de datos, slo se har la prediccin de los valores de variable dependiente para los Casos con etiqueta "predecir". Opciones Establece la ubicacin del valor de la prediccin y las opciones de prediccin en vivo. 1) Colocar valores de prediccin en el conjunto de datos. Esta opcin especifica que los valores de la prediccin se coloquen en la ubicacin de la variable dependiente del conjunto de datos para cada caso de la prediccin, adems de colocarse posiblemente en el Informe detallado (dependiendo de si los Informes Detallados estn seleccionados en la configuracin Informes a generar de las Configuraciones de aplicacin). Esta opcin sustituir el contenido actual de la celda, por lo que debe usarse con cuidado. Podr identificar los valores de prediccin por su color en el conjunto de datos. 2) Activar prediccin en vivo Especifica que NeuralTools colocar frmulas en las celdas en las que aparecen los valores de la prediccin de la variable dependiente. Estas frmulas permiten a NeuralTools calcular los valores de la prediccin cuando se cambian los valores independientes. 3) Excluir prediccin en vivo para casos con valores que faltan o no vlidos Especifica que la frmula de prediccin en vivo no se aada cuando falten los valores de la variable de entrada de un caso. Los valores de entrada que faltan generan un valor de error en las frmulas de prediccin en vivo. Sin embargo, puede ser til permitir que NeuralTools introduzca frmulas en casos en los que falten los valores independientes, porque en cuanto se introduzcan los valores que faltan, la prediccin aparecer automticamente.

72

Referencia de comandos

Prediccin en vivo

Prediccin en vivo es una eficaz funcin de NeuralTools (slo en la versin Industrial) que permite realizar predicciones automticamente en Excel sin tener que realizar una operacin de Prediccin especfica. Con la prediccin en vivo, NeuralTools coloca frmulas en las celdas en las que aparecen los valores de la prediccin de la variable dependiente. Estas frmulas usan una funcin personalizada de NeuralTools para calcular los valores de la prediccin, como sucede en: =NetOutputPrediction(_PALDS_DG25B8C82B!$A$140, DG25B8C82B, VG1DD83AF2, 'Datos de Prediccin'!$A$6:$I$6, A7:I7) NeuralTools aade la frmula a la hoja de clculo y no es necesario que usted la introduzca. Los argumentos permiten a NeuralTools identificar la red entrenada en uso, as como la ubicacin de los valores independientes en la hoja de clculo. Cuando se aaden o cambian los valores de variable independiente de entrada de un caso, NeuralTools genera automticamente un nuevo valor de prediccin. Esto facilita la introduccin y generacin de predicciones para nuevos casos usando una red entrenada existente. Nota: Si la prediccin se basa en valores de celda que no se espera que cambien, se recomienda deseleccionar la prediccin en vivo en el cuadro de dilogo de entrenamiento o prediccin; para minimizar el tiempo que tarda Excel en recalcular el libro de trabajo.

Referencia: Comandos del men de NeuralTools

73

Cuadro de dilogo Previsualizacin de prediccin

El cuadro de dilogo Previsualizacin de prediccin muestra la configuracin de la prediccin del conjunto de datos seleccionado junto con cualquier error detectado en los datos o configuraciones, antes de iniciarse la prediccin. Examinando el contenido de este cuadro de dilogo podr ver todas las presuposiciones de prediccin seleccionadas segn estn en NeuralTools. La seccin Errores y advertencias ofrece una descripcin de cualquier problema detectado por NeuralTools en los datos que podr corregir si fuera necesario antes de hacer la prediccin.

74

Referencia de comandos

Informes de prediccin

Despus de la prediccin se pueden crear informes de resumen y detallados. Estos informes detallan el funcionamiento de la red neuronal entrenada con el conjunto de datos de prueba. El contenido de los informes generados se especifica en el cuadro de dilogo Configuraciones de aplicacin, en las configuraciones Informes a generar y Columnas en los informes detallados. Informe detallado de prediccin. Este informe se coloca junto al conjunto de datos de la prediccin. Proporciona una ubicacin para las predicciones cuando el usuario no quiere colocarlas dentro de la variable dependiente del propio conjunto de datos; si la variable dependiente contiene datos histricos de algunos casos, es ms seguro no mezclar esos casos histricos con las predicciones de la red.

Si ejecuta mltiples predicciones, los informes detallados se pueden aadir en nuevas columnas a la derecha del conjunto de datos, para que pueda ver cmo cambian las predicciones en cada caso individual con el uso de nuevas redes entrenadas.

Referencia: Comandos del men de NeuralTools

75

76

Utilidades
El comando Configuraciones de aplicacin
Especifica las configuraciones de los informes de entrenamiento, prueba y prediccin El comando Configuraciones de aplicacin permite seleccionar 1) los informes que se van a generar para entrenamiento, prueba y prediccin, 2) las configuraciones predeterminadas de Entrenamiento que se van a usar y 3) las configuraciones predeterminadas de Prediccin y Tiempo de ejecucin que se van a usar. Muchas de las Configuraciones de aplicacin son los valores predeterminados que se usarn en los cuadros de dilogo de Entrenamiento, Prueba y Prediccin. Para obtener ms informacin sobre esas configuraciones, consulte la descripcin de esos cuadros de dilogo. Las dems configuraciones se explican aqu.

Referencia: Comandos del men de NeuralTools

77

Informes

Las opciones de Informes son: Informes a generar Cada una de las operaciones de NeuralTools puede generar un informe de resumen y otro detallado. Sin embargo, normalmente conviene utilizar la configuracin de informes predeterminada, ya que ciertos informes aportan poca informacin a algunas operaciones. Por ejemplo, el informe detallado es el informe estndar de prediccin, porque el informe de resumen aporta poco.

Los informes de resumen se colocan en sus propias hojas de clculo, mientras que los informes detallados se colocan en columnas a la derecha del conjunto de datos, en la misma hoja de clculo que el conjunto de datos. Las opciones de Colocar informes de resumen en son: Nuevo libro de trabajo, cuando se crea una nueva hoja de clculo para cada informe. Para los informes puede reutilizar el mismo libro de trabajo o crear siempre un libro de trabajo nuevo. Sustituir informes existentes, cuando las columnas que contienen los datos de Informes Detallados anteriores se sustituyen por nuevos Informes Detallados (para eliminar un Informe detallado manualmente, seleccione todas las columnas que lo contienen haciendo clic y arrastrando el ratn sobre los encabezamientos de las columnas, y luego seleccione Eliminar en el men Editar). A la derecha del conjunto de datos, cuando las columnas de los nuevos Informes Detallados se introducen a la derecha del conjunto de datos. A la derecha de los informes existentes, cuando los nuevos Informes Detallados se introducen en las columnas situadas a la derecha del conjunto de datos y de los informes existentes.

Las opciones de Localizacin del informe detallado son: -

78

Utilidades

Columnas en los informes detallados. Por cada fila seleccionada, aparecer a la derecha del conjunto de datos una columna del Informe detallado que mostrar la informacin de cada caso.

Se pueden mostrar las siguientes columnas: 1) Etiqueta usada Muestra las etiquetas entrenar, probar y predecir en cada caso si se usaron durante el entrenamiento o la prueba, o si se hizo una prediccin para un caso determinado. Prediccin obtenida usando red Nmero o categora de prediccin de la red. Probabilidad de la categora de prediccin (para PNN) Las Redes neuronales probabilsticas no slo predicen una categora desconocida, sino que asignan una probabilidad a esa categora. No est disponible cuando las categoras se predicen usando redes multinivel siempre hacia adelante. No es aplicable en las predicciones numricas. Probabilidad de las categoras incorrectas (para PNN) Suma de las probabilidades asignadas por una red PN a categoras incorrectas. Por ejemplo, si en un caso determinado la red asigna un 30% de probabilidad al rojo, un 20% al amarillo y un 50% al verde, y sabemos que la respuesta correcta es rojo, entonces el valor para ese caso es 20% + 50% = 70%. Esta columna proporciona una medida de error caso por caso para la prediccin de categora, correspondiente a la columna Error residual en la prediccin numrica. Error residual la diferencia entre el valor dependiente real y el de la prediccin. No es aplicable en las predicciones de categora.
79

2) 3)

4)

5)

Referencia: Comandos del men de NeuralTools

6)

Evaluaciones correctas / incorrectas En las predicciones numricas, la columna indica si la prediccin de un caso determinado se encuentra dentro del margen definido alrededor del valor real; el ancho del margen se define en Evaluacin de tolerancia correcta / incorrecta. En las predicciones de categora, la columna simplemente indica si la categora de la prediccin coincide con la real. Probabilidad de todas las categoras (para PNN) Si se selecciona esta opcin y se entrena una red neuronal probabilstica, se inserta una columna por cada categora dependiente. Por ejemplo, si la red se usa para predecir un color, puede haber columnas par rojo%, amarillo% y verde%, que contienen las probabilidades asignadas a cada color.

7)

Evaluacin de tolerancia correcta / incorrecta. En pruebas y entrenamientos, si una prediccin numrica est dentro del % introducido del valor real de la variable dependiente, se etiqueta como correcta.

80

Utilidades

El comando Administrador de red neuronal


Permite copiar, mover y eliminar redes neuronales entrenadas El comando Administrador de red neuronal permite administrar las redes neuronales entrenadas, para moverlas entre libros de trabajo o aadir informacin descriptiva.

Las redes neuronales se pueden guardar en un libro de trabajo de Excel o en un archivo del disco. Se puede colocar en un solo libro de trabajo de Excel un nmero ilimitado de redes. Usando el Administrador de red neuronal, puede mover redes a libros de trabajo o archivos, eliminarlas o reemplazarlas. Esto permite analizar fcilmente conjuntos de datos de otros libros de trabajo usando redes neuronales existentes, sin que est presente el libro de trabajo con los datos de entrenamiento.

Referencia: Comandos del men de NeuralTools

81

Las opciones del Administrador de red neuronal son: Copiar Permite copiar una red neuronal entrenada en una ubicacin diferente. Slo tiene que seleccionar el libro de trabajo o el archivo donde desea colocar la red.

Quitar Elimina la red neuronal entrenada. Reemplazar Sustituye una red neuronal entrenada por otra nueva. Esta funcin est disponible con las redes que se usan para prediccin en vivo. Despus del reemplazo, las predicciones en vivo que se hicieron anteriormente usando la red antigua se harn con la nueva. Esto no es aplicable en los Informes Detallados. Si un informe detallado contiene celdas de predicciones en vivo en las que se usa la red que se va a reemplazar, despus del reemplazo los valores de las celdas sern fijos. Informacin de red Permite introducir informacin descriptiva en la red. Ayuda a identificar la red entrenada y las condiciones en las que se entren.

82

Utilidades

El comando Utilidades de reemplazo de datos


Permite reemplazar los datos que faltan y los valores errneos de un conjunto de datos por valores artificiales El comando Utilidades de reemplazo de datos permite reemplazar datos que faltan y otros datos no deseados del conjunto de datos por valores artificiales. NeuralTools descarta los casos a los que le faltan valores de variables en el entrenamiento, prueba y prediccin; por lo tanto, conviene corregir estos casos antes de procesarlos. El cuadro de dilogo Previsualizacin de entrenamiento mostrar una advertencia cuando haya casos a los que les falten valores en el conjunto de datos. Si esto sucede, estos casos se pueden corregir usando el comando Utilidades de reemplazo de datos.

El cuadro de dilogo Utilidades de reemplazo de datos contiene las siguientes opciones: Variables a modificar Proporciona una lista de las variables en uso del conjunto de datos de la hoja de clculo actual y muestra el nmero de datos que faltan, son errneos (para las variables numricas) o no son numricos. Si marca una variable la selecciona para que se reemplacen los datos que faltan o no deseados.

Referencia: Comandos del men de NeuralTools

83

La lista de variables proporciona un men que se activa con el botn derecho de ratn que incluye comandos para la seleccin y deseleccin de grupos de variables. Valores a reemplazar Selecciona el tipo de valores de las variables seleccionadas que se van a reemplazar. Valor especfico permite reemplazar todos los casos de una valor especfico de una variable por un nuevo valor. Qu usar como reemplazo Especifica los valores que se van a colocar en el conjunto de datos en lugar de los datos que faltan o no deseados. Se especifican diferentes valores para las variables de Categora y Numricas: Las opciones de Variables de categora son: Categora ms frecuente o menos frecuente El valor de categora que aparece con mayor frecuencia o con menor frecuencia en los casos del conjunto de datos Categora adyacente El valor de categora que aparece en el caso del conjunto de datos junto al caso al que le falta el valor Categora seleccionada aleatoriamente Un valor de categora seleccionado aleatoriamente de entre los del conjunto de datos Categora especfica Establece un valor especfico para todos los valores que faltan o no deseados Valor promedio de la variable El valor promedio de la variable de todos los casos del conjunto de datos Valor de la mediana de la variable El valor de la mediana de la variable de todos los casos del conjunto de datos Interpolacin de valores adyacentes El valor calculado mediante la interpolacin entre los valores de la variable de los casos del conjunto de datos situado junto al caso al que le falta el valor Val aleatorio (entre Mn. y Mx.) Un valor aleatorio seleccionado entre el mnimo y el mximo de la variable de todos los casos del conjunto de datos

Las opciones de Variables numricas son: -

Para ambos tipos de variable, Borrar celdas borra los valores seleccionados de la variable.

84

Utilidades

Informacin adicional sobre valores que faltan

El cuadro de dilogo Utilidades de reemplazo de valores proporciona una forma de resolver los datos que faltan: genera datos artificiales donde faltan datos reales. A veces es mejor dejar los datos que faltan como celdas en blanco, y permitir que NeuralTools descarte casos a los que les faltan datos. Recuerde que NeuralTools no reconoce smbolos especiales como ? en lugar de datos que faltan; los signos de interrogacin deben borrarse, y esto se puede hacer con el comando Utilidades de reemplazo de datos, seleccionando Valor especfico en la seccin Valores a reemplazar, y seleccionando Borrar celdas en la seccin Qu usar como reemplazo. Tambin es posible usar NeuralTools para predecir valores que faltan en una de las variables independientes a partir de otras variables independientes a las que no les faltan datos o les faltan muy pocos. Los resultados de la prueba indicarn si una red entrenada para predecir valores que faltan es fiable.

Referencia: Comandos del men de NeuralTools

85

86

Informacin adicional sobre redes neuronales


Fundamentos de las redes neuronales
Una red neuronal es un sistema que toma valores numricos de entrada, realiza permutaciones con esos valores de entrada, y genera uno o ms valores numricos de salida. Cuando se disea y entrena una red neuronal para una aplicacin especfica, genera valores de salida aproximadamente correctos para valores de entrada determinados. Por ejemplo, una red puede tener valores de entrada que representen algunas caractersticas fcilmente cuantificables de un molusco (una oreja marina), como su longitud, dimetro y peso. Los clculos realizados dentro de la red dan como resultado un solo nmero, que generalmente es cercano a la edad del animal (la edad de una oreja de mar es difcil de determinar). Las redes neuronales se inspiran en la estructura del cerebro. Un cerebro consta de un gran nmero de clulas, conocidas como neuronas. La neurona recibe impulsos de otras neuronas a travs de las dendritas. Dependiendo de los impulsos recibidos, la neurona puede enviar una seal a otras neuronas, a travs de su axn, que conecta con las dendritas de otras neuronas. Como en el cerebro, las redes neuronales artificiales constan de elementos, cada uno de los cuales recibe una serie de valores de entrada, y genera una sola salida, cuyo valor es una funcin relativamente sencilla de los valores de entrada.

Informacin adicional sobre redes neuronales

87

Redes neuronales y mtodos estadsticos


Las redes neuronales proporcionan una alternativa a los ms tradicionales mtodos estadsticos. Como la regresin lineal, sirve para aproximacin de funciones. Como el anlisis discriminatorio y la regresin logstica, sirve para clasificacin. La ventaja de las redes neuronales es que son capaces de modelar funciones extremadamente complejas. Esta capacidad contrasta con las tcnicas lineales tradicionales (regresin lineal y anlisis discriminatorio lineal). Las tcnicas para optimizar modelos lineales eran bien conocidas antes de la invencin de las redes neuronales a mediados del Siglo XX. Se tardaron muchos aos en desarrollar algoritmos eficaces para el entrenamiento de redes neuronales. Sin embargo, ahora contamos con una serie de sofisticados algoritmos para el entrenamiento de redes neuronales que son una atractiva alternativa a los mtodos ms tradicionales.

La estructura de una red neuronal


La estructura de una red neuronal consta de unidades conectadas denominadas nodos o neuronas. Cada neurona realiza una parte del clculo dentro de la red: la neurona toma algunos nmeros como valores de entrada, realiza un clculo relativamente simple con esos valores de entrada, y genera un valor de salida. El valor de salida de una neurona se convierte en uno de los valores de entrada de otra neurona, excepto en las neuronas que generan los valores de salida finales de todo el sistema. Las neuronas estn organizadas en capas o niveles. Las neuronas de las capas de entrada reciben los valores de entrada para los clculos, como la longitud, dimetro y peso de un molusco determinado. Estos valores se trasladan a las neuronas de la primera capa oculta, que realizan los clculos de sus valores de entrada y trasladan sus valores de salida a la siguiente capa. La siguiente capa puede ser otra capa oculta, si es el caso. Los valores de salida de las neuronas de la ltima capa oculta se trasladan a la neurona o neuronas que general los resultados de salida finales de la red, como puede ser la edad del molusco.

88

Fundamentos de las redes neuronales

Prediccin numrica y de categoras


Cuando las redes neuronales se usan para predecir valores numricos, normalmente slo tienen un valor de salida. La razn es que las redes con un solo valor de salida son ms fiables que las redes con mltiples valores de salida, y casi cualquier problema de prediccin se puede resolver usando redes con un solo valor de salida. Por ejemplo, en lugar de construir una sola red para predecir el volumen y el precio de un valor de bolsa para el da siguiente, es mejor crear una red para las predicciones de precio y otra para las predicciones de volumen. Por otro lado, las redes neuronales tienen mltiples valores de salida cuando se utilizan para la prediccin de clasificacin /categora. Por ejemplo, supongamos que queremos predecir si el precio de un valor de bolsa subir ms del 1%, bajar ms del 1% o no cambiar ms del 1% para el da siguiente. La red tendr tres valores numricos de salida y el valor de salida mayor indicar la categora seleccionada por la red.

Entrenamiento de una red


El entrenamiento de una red es un proceso de ajuste fino de los parmetros de un clculo, en el que el propsito es que el la red genere valores de salida que sean aproximadamente correctos para una serie de valores de entrada. Este proceso est dirigido por los datos de entrenamiento por un lado, y por el algoritmo de entrenamiento por el otro. El algoritmo de entrenamiento selecciona varios grupos de parmetros de clculo, y evala cada grupo aplicando la red a cada caso de entrenamiento para determinar lo adecuadas que son las respuestas dadas por la red. Cada grupo de parmetros es una prueba; el algoritmo de entrenamiento selecciona nuevos grupos de parmetros basndose en los resultados de pruebas anteriores.

Informacin adicional sobre redes neuronales

89

Procesamiento en computadora de las redes neuronales


Una red neuronal es un modelo de clculos que se pueden realizar en varios tipos de hardware de computadora. Una red neuronal se puede construir con pequeos elementos de procesamiento, cada uno de los cuales realiza el trabajo de una sola neurona. Sin embargo, las redes neuronales normalmente se realizan en una computadora con un solo procesador de gran potencia, como el que usan la mayora de las computadoras actuales. Con computadoras con un solo procesador, programas como NeuralTools usan el mismo procesador para realizar los clculos de cada neurona; en este caso, el concepto de neurona describe una parte de los clculos necesarios para obtener una prediccin, y no un elemento de procesamiento fsico.

Tipos de redes neuronales


Hay varios tipos de redes neuronales que difieren en estructura, tipo de clculos que realizan dentro de las neuronas y algoritmos de entrenamiento. Uno de los tipos que se ofrece en NeuralTools es la Red multinivel siempre hacia adelante. Con las redes MLF, un usuario de NeuralTools puede especificar si debe haber una o dos capas de neuronas ocultas, y cuntas neuronas deben contener las capas ocultas (NeuralTools ofrece ayuda para hacer las selecciones apropiadas, como se describe en la seccin Redes MLF). NeuralTools tambin ofrece Redes neuronales de regresin generalizada y Redes neuronales probabilsticas; ambas estn estrechamente relacionadas, siendo las primeras para predicciones numricas, y las ltimas para predicciones de clasificacin / categora. En las redes GRN/PN no hay necesidad de que el usuario tome decisiones sobre la estructura de la red. Estas redes tienen siempre dos capas ocultas de neurona, con una neurona por caso entrenado en la primera capa oculta, y un tamao de la segunda capa determinado por ciertas caractersticas de los datos de entrenamiento. Las secciones restantes de este captulo tratan con ms detalle cada uno de los tipos de red neuronal que ofrece NeuralTools.

90

Fundamentos de las redes neuronales

Redes multinivel siempre hacia adelante


Las Redes multinivel siempre hacia adelante (tambin conocidas como Redes de Perceptrn de Mltiples Capas) son sistemas capaces de aproximacin de funciones complejas y, por lo tanto, capaces de modelar relaciones complejas entre variables independientes y una variable dependiente.

La arquitectura MLF
El siguiente diagrama muestra una red MLF para la prediccin numrica con tres variables numricas independientes; la red se ha configurado para que tenga 2 neuronas/nodos en la primera capa oculta, y 3 neuronas/nodos en la segunda capa oculta.

Salida

Segunda capa oculta

Primera capa oculta

Entradas

El funcionamiento de la red se determina por: Su topologa (el nmero de capas ocultas y el nmero de nodos de esas capas) Los pesos de las conexiones (un parmetro asignado a cada conexin) y los trminos de tendencia (un parmetro asignado a cada neurona) La funcin de activacin / transferencia que se usa para convertir los valores de entrada de cada neurona en su valor de salida
Informacin adicional sobre redes neuronales 91

Ms especficamente, una neurona oculta con n valores de entrada calcula primero una suma clasificada de sus valores de entrada: Suma = in0 * w0 + in1 * w1 + ... + inn * wn + tendencia donde de in0 a inn son valores de salida de las neuronas de la capa anterior, mientras que de w0 a wn son los pesos de conexin; cada neurona tiene su propio valor de tendencia. Luego se aplica la funcin de activacin a la Suma para generar el valor de salida de la neurona. Se usa una funcin sigmoide (con forma de s) como funcin de activacin en las neuronas de la capa oculta. Concretamente, NeuralTools usa la funcin de tangente hiperblica. En NeuralTools, la neurona de salida usa la identidad como funcin de activacin; es decir, simplemente genera la suma clasificada de sus valores de entrada. Las redes neuronales a veces se construyen con funciones de activacin sigmoides en las neuronas de salida. Sin embargo, eso no es necesario en una red neuronal para que pueda aproximar las funciones complejas. Adems, las funciones sigmoides tienen rangos de salida restringidos (de -1 a 1 para la funcin de tangente hiperblica) y normalmente habr valores dependientes situados fuera del rango. Por lo tanto, el uso de una funcin sigmoide en la neurona de salida fuerza una transformacin adicional de los valores de salida antes de transferir los datos de entrenamiento a la red. Cuando se usan las redes MLF para clasificacin, tienen mltiples neuronas de salida, cada una de las cuales corresponde a una de las posibles categoras dependientes. Una red clasifica cada caso calculando sus valores de salida numricos; la categora seleccionada es la que corresponde a la neurona que genera el valor de salida ms alto.

92

Redes multinivel siempre hacia adelante

Entrenamiento de una red MLF


El entrenamiento de una red MLF consiste en encontrar una serie de pesos y trminos de tendencia para las conexiones que permitan que la red genere por lo general respuestas correctas cuando se le presentan nuevos casos (para simplificar, omitiremos el trmino de tendencia en la siguiente presentacin). El entrenamiento comienza con la asignacin de una serie de pesos de conexiones seleccionados aleatoriamente. Se hace una prediccin para cada caso del entrenamiento (usando valores independientes como valores de entrada para obtener un valor de salida). El valor de salida ser seguramente diferente al valor dependiente conocido. Por lo tanto, en cada caso de entrenamiento obtenemos un valor de error. A partir de estos valores calculamos una medida de error para el conjunto de entrenamiento completo, que nos indica el funcionamiento de la red con los pesos iniciales utilizados. La red no funcionar demasiado bien con la asignacin aleatoria inicial de pesos y habr que proceder con subsiguientes pruebas: nuevas asignaciones de pesos. Sin embargo, las asignaciones de pesos ya no sern aleatorias, sino que sern seleccionadas por el algoritmo de entrenamiento: un mtodo para seleccionar pesos de conexiones basado en los resultados de pruebas anteriores. El problema es de optimizacin: queremos minimizar la medida de error cambiando los pesos de las conexiones.
Datos histricos

El primer algoritmo para el entrenamiento de pesos de conexiones en redes MLF era de propagacin hacia atrs; en la actualidad los investigadores tienden a favorecer otros algoritmos ms rpidos y con mayor probabilidad de encontrar resultados globales ptimos. NeuralTools usa el mtodo de Gradiente descendente conjugado, que pertenece a la categora de mtodos de optimizacin de segundo orden. Estos mtodos de optimizacin determinsticos han sido diseados para encontrar el mnimo local de una funcin: evolucionan eficazmente pendiente abajo en la funcin de error. Para reducir el riesgo de encontrar el mnimo local en lugar del global, NeuralTools combina mtodos de optimizacin determinsticos y estocsticos. Ms especficamente, se usa el mtodo estocstico Recocido Simulado junto con el mtodo Gradiente Descendente Conjugado. El algoritmo decide el mtodo que se debe usar en un punto determinado, basndose en los resultados de pruebas anteriores. Para obtener ms informacin sobre el mtodo Gradiente Descendente Conjugado, consulte Bishop (1995) y Masters (1995). Para obtener informacin adicional sobre el mtodo Recocido Simulado consulte Masters (1995).
93

Informacin adicional sobre redes neuronales

Medidas de error

La medicin del error que se utiliza cuando se entrenan redes de prediccin numrica es el error cuadrtico medio de todos los casos del entrenamiento; es decir, el cuadrado de la media de la diferencia entre la respuesta correcta y la respuesta dada por la red. En las clasificaciones, cada caso de entrenamiento tiene ms de un valor de salida (cada valor de salida corresponde a una categora dependiente). Calculamos el error cuadrtico medio de todos los valores de salida de todos los casos entrenados, en referencia a los valores de salida deseados: por cada caso entrenado queremos que el valor de salida sea cercano a 1 para el valor de salida correspondiente a la categora correcta, y el resto de los valores de salida sean cercanos a 0. Los algoritmos de entrenamiento de MLF de NeuralTools se reinicia a s mismo mltiples veces desde pesos iniciales diferentes. Por lo tanto, cuanto ms se entrena una red, mejor. Cuantas ms veces se pueda reiniciar, ms probable ser que encuentre el mnimo global de la funcin de error. La seleccin del nmero de capas y del nmero de neuronas de cada capa determina si la red es capaz de aprender la relacin entre las variables independientes y las dependientes. Normalmente, una red con una sola capa oculta y dos neuronas ocultas no ser capaz de entrenarse hasta alcanzar un nivel satisfactorio de error. Sin embargo, aumentar el nmero de capas y neuronas tiene un precio que normalmente no vale la pena pagar. Una sola capa oculta es suficiente para casi cualquier problema; el uso de dos capas normalmente resulta en largos tiempos de entrenamiento innecesarios. Adems, unas pocas neuronas en una sola capa oculta normalmente es suficiente. NeuralTools puede autoconfigurar la topologa de la red basndose en los datos entrenados. Sin embargo, la funcin de Bsqueda de mejor red ofrece un mtodo ms fiable. Como parte de la Bsqueda de mejor red, se entrena un rango de redes de una sola capa oculta con diferente nmero de neuronas. La opcin predeterminada es cinco redes MLF, con un nmero de neuronas ocultas entre 2 y 6. Si dispone de tiempo suficiente, el rango se puede ampliar; pero se recomienda que empiece con redes de 2 neuronas por razones relacionadas con el exceso de entrenamiento.

Tiempo de Entrenamiento

Seleccin de topologa

94

Redes multinivel siempre hacia adelante

Cmo evitar el exceso de entrenamiento

El trmino exceso de entrenamiento se refiere a una situacin en la que la red aprende no slo las caractersticas generales de la relacin entre las variables independientes y la variable dependiente, sino que adems empieza a aprender caractersticas de los casos de entrenamiento que no son aplicables en general; es decir, que no se aplicarn a los casos que no son del entrenamiento. A veces, para resolver este problema, se divide el conjunto de entrenamiento en un conjunto de prueba y entrenamiento y otro conjunto de entrenamiento apropiado, que se usar despus del entrenamiento. El error del conjunto de prueba y entrenamiento se calcula peridicamente durante el entrenamiento. Cuando comienza a aumentar, se interpreta como una seal de que la red empieza a tener un entrenamiento excesivo, y el entrenamiento se detiene. NeuralTools utiliza un mtodo diferente para evitar el exceso de entrenamiento. El mtodo de dos conjuntos distintos de entrenamiento normalmente no es realista, porque normalmente no hay suficientes datos como para dividirlos en un conjunto de entrenamiento y dos conjuntos de prueba. Adems, el aumento del error de un conjunto de entrenamiento y prueba no es un indicador fiable de un exceso de entrenamiento; el aumento puede ser local, y el error podra reducirse con el entrenamiento. La Bsqueda de mejor red de NeuralTools ha sido diseada para evitar el exceso de entrenamiento. Con las configuraciones predeterminadas, la Bsqueda de mejor red se inicia con una red de 2 neuronas, que es normalmente demasiado pequea para producir exceso de entrenamiento. Con las configuraciones predeterminadas, entrenar redes de hasta 6 neuronas. Si las redes de 5 y 6 neuronas producen un exceso de entrenamiento, aparecer en los resultados del conjunto de entrenamiento, y una de las redes de 2, 3 o 4 neuronas tendr el error de prueba ms bajo.

Informacin adicional sobre redes neuronales

95

96

Redes neuronales de regresin generalizada y redes neuronales probabilsticas


Las redes neuronales de regresin generalizada y las redes neuronales probabilsticas se basan en ideas similares. Las redes GRN se usan para aproximacin de predicciones / funciones numricas, mientras que las redes PN se usan para predicciones de categoras y clasificacin. Ambos tipos de redes fueron presentadas por Donald Specht (Probabilistic Neural Networks, Neural Networks, 3, 1990, pp. 109-118; A General Regression Neural Network, IEEE Transactions on Neural Networks, 2, 1991, pp. 568-576). Se tratan en Masters (1995), cuya presentacin se resume a continuacin. Consulte estas fuentes para obtener informacin adicional.

Redes neuronales de regresin generalizada


Como ejemplo, considere el conjunto de datos de entrenamiento que se muestra en el grfico, con una variable numrica independiente y una variable numrica dependiente.

1200 1000 800 600 400 200 0 -12 -10 -8 -6 -4 -200 -2 0 -400 -600 -800 -1000 2 4 6 8 10 12

Informacin adicional sobre redes neuronales

97

Un observador humano puede detectar un patrn en los datos. Si nos preguntan cul es el valor dependiente desconocido del valor independiente 6, podemos estimar que es mayor de 200 y menor de 400. Observe que esta estimacin no se basa en los dos casos conocidos ms cercanos, que indicaran un valor por debajo de 200; estamos observando casos ms all de los ms cercanos. Sin embargo, no prestamos demasiada atencin a casos con valores independientes alrededor de -10; cuanto ms cercano est un caso conocido a uno desconocido, ms peso se le da a la hora de estimar el valor dependiente desconocido. La red neuronal de regresin generalizadase construye sobre estas ideas intuitivas. Cada caso de entrenamiento se representa en la red. Cuando se le presenta el caso, la red calcula el valor dependiente de prediccin usando los valores dependientes de cada caso de entrenamiento, y los casos de entrenamiento cercanos contribuyen de forma ms significativa al valor de salida.
La arquitectura GRN

Una red neuronal de regresin generalizadapara dos variables numricas independientes se estructura como se muestra en el grfico (suponiendo que slo hay tres casos):

Salida

Capa de suma (nodos numerador y denominador)

Capa de patrn (una neurona por caso de entrenamiento) Entradas

98

Redes neuronales de regresin generalizada y redes neuronales probabilsticas

La capa de patrn contiene un nodo por cada caso de entrenamiento. La presentacin de un caso de entrenamiento en la red, en este caso consiste en la presentacin de dos valores numricos independientes. Cada neurona de la capa de patrn calcula su distancia con el caso presentado. Los valores transferidos a los nodos numerador y denominador son funciones de la distancia y del valor dependiente. Los dos nodos de la capa de suma suman sus valores de entrada, mientras que el nodo de salida los divide para generar la prediccin. La funcin de distancia calculada en las neuronas de la capa de patrn usa factores de suavizacin; cada valor de entrada tiene su propio valor de factor de suavizacin. Con un solo valor de entrada, cuanto mayor sea el valor del factor de suavizacin, ms significativos sern los casos entrenados distantes para el valor de prediccin. Con 2 valores de entrada, el factor de suavizacin est en relacin con la distancia a lo largo del eje de un plano y, en general, con mltiples valores de entrada, la relacin es con una dimensin en un espacio multidimensional. La red GRN entrenada consta de factores de suavizacin optimizados para minimizar el error de la red entrenada, y para hacerlo se utiliza el mtodo de optimizacin de gradiente descendente conjugada. La medida de error que se usa durante el entrenamiento para evaluar diferentes conjuntos de factores de suavizacin es el error cuadrtico medio. Sin embargo, cuando se calcula el error cuadrtico de un caso entrenado, ese caso se excluye temporalmente de la capa de patrn. Esto se hace porque la neurona excluida calculara una distancia cero, haciendo que otras neuronas fueran insignificantes para el clculo de la prediccin.

Informacin adicional sobre redes neuronales

99

Redes neuronales probabilsticas


Volviendo a las Redes neuronales probabilsticas, considere los siguientes datos de entrenamiento con 2 variables numricas independientes y una variable dependiente con 2 categoras:

Los crculos representan casos de entrenamiento en una categora, mientras que los cuadrados pertenecen a la otra categora. Queremos predecir la categora de los casos que aparecen con el signo de interrogacin. Un observador humano decidira que el caso est ms probablemente en la categora del crculo que en la categora del cuadrado. Sin embargo, muchos mtodos de clasificacin no pueden alcanzar la misma conclusin. Los mtodos que requieren una separabilidad lineal de categoras, fracasarn. Los mtodos de vecino ms cercano asignarn un caso desconocido a la categora del cuadrado. Tambin lo harn los mtodos que se concentran en las tendencias centrales, ya que el caso desconocido est ms cercano al centroide de la categora del cuadrado que al centroide de la categora del crculo. Por su parte, la red PN tomar la decisin correcta. Considerar la distancia del nuevo caso con cada caso de entrenamiento, dando mayor peso a los casos ms cercanos. El efecto del cuadrado cercano ser compensado por los crculos situados en las inmediaciones.

100

Redes neuronales de regresin generalizada y redes neuronales probabilsticas

La arquitectura PN

Una Red neuronal probabilstica se estructura como se muestra en el grfico, donde se presupone que hay dos variables numricas independientes, dos categoras dependientes y cinco casos de entrenamiento (tres en una categora y dos en otra):

Salida

Capa de suma (una


neurona por categora)

Capa de patrn (una neurona por caso de entrenamiento) Entradas


Cuando se presenta un caso en la red, cada neurona de la capa de patrn calcula la distancia entre el caso de entrenamiento representado por la neurona y el caso de entrada. El valor transferido a las neuronas de la capa de suma es una funcin de la distancia y los factores de suavizacin. Como en las redes GRN, cada valor de entrada tiene su propio factor de suavizacin; esos factores determinan la rapidez con la que se reduce la significancia de los casos de entrenamiento con la distancia. En la capa de suma hay una neurona por cada categora dependiente; cada neurona suma los valores de salida de las neuronas correspondientes a los casos de entrenamiento de esa categora. Los valores de salida de las neuronas de la capa de suma se pueden interpretar como estimaciones de funcin de densidad de probabilidad de cada clase. La neurona de salida selecciona como categora de la prediccin la categora con el mayor valor de funcin de densidad de probabilidad.

Informacin adicional sobre redes neuronales

101

Con en la redes GRN, el entrenamiento de una red PN consta de factores de suavizacin optimizados para minimizar el error de la red entrenada, y para hacerlo se utiliza el mtodo de optimizacin de Gradiente Descendente Conjugada. La medida de error que se usa durante el entrenamiento para evaluar diferentes grupos de factores de suavizacin se calcula basndose en todos los valores generados por las neuronas de la capa de suma de todos los casos de entrenamiento. La medicin tiene en cuenta no slo la probabilidad asignada a la categora correcta, sino tambin las probabilidades de distribucin asignadas a las categoras incorrectas (es mejor la distribucin aproximadamente uniforme de probabilidades entre categoras incorrectas que algunas categoras incorrectas tengan una probabilidad alta). Recuerde que cuando se calcula el error de un caso entrenado, ese caso se excluye temporalmente de la capa de patrn. Esto se hace porque la neurona excluida calculara una distancia cero, haciendo que otras neuronas fueran insignificantes para el clculo.

102

Redes neuronales de regresin generalizada y redes neuronales probabilsticas

Comparacin de redes MLF y redes PN/GRN


Cada uno de los tipos de Redes Neuronales disponibles en NeuralTools tiene ventajas e inconvenientes, como se explica a continuacin: Ventajas de las redes GRN/PN: Se entrenan rpido No requieren una especificacin de topologa (nmero de capas ocultas y nodos) Las redes PN no slo clasifican, sino que tambin generan probabilidades de que el caso se encuentre en diferentes categoras dependientes posibles Ventajas de las redes MLF: De tamao ms pequeo, pero ms rpidas para hacer predicciones Son ms fiables fuera del rango de los datos de entrenamiento (por ejemplo, cuando el valor de alguna variable independiente se encuentra fuera del rango de valores de esa variable en los datos de entrenamiento); si bien debe recordarse que la prediccin fuera del rango de los datos de entrenamiento sigue teniendo riesgo con las redes MLF Son capaces de generalizar a partir de conjuntos de entrenamiento muy pequeos

Informacin adicional sobre redes neuronales

103

104

Transformacin de valores de entrada


NeuralTools aplica una escala a las variables numricas antes del entrenamiento, de forma que los valores de cada variable se encuentran aproximadamente en el mismo rango. Esto se hace para igualar el efecto que las variables tienen sobre el valor de salida de la red durante las fases iniciales del entrenamiento. Cuando una variable no es significativa para hacer predicciones correctas, se refleja durante el entrenamiento mediante la reduccin de los pesos de las conexiones que llevan de un valor de entrada a las neuronas de la primera capa oculta. Sin embargo, si esa variable insignificante tiene un orden de magnitud ms grande que otras variables, los pesos deben reducirse mucho ms para compensar los valores ms grandes. La escala usa la media y la desviacin estndar para cada variable, calculadas en el conjunto de entrenamiento. La media se resta de cada valor y el resultado se divide entre la desviacin estndar. Los mismos parmetros de escala se usan cuando se prueba la red entrenada o cuando se usa para hacer predicciones. Los datos de categora / simblicos no se pueden usar directamente en la red neuronal, cuyos valores de entrada deben ser nmeros. En consecuencia, cada una de las variables de categora independientes se representa por una serie de entradas numricas de red, una por cada categora posible. Se usa el mtodo de conversin una de n. Por ejemplo, observe el siguiente conjunto de casos entrenados: Edad 41 32 54 37 Estado NY CT NJ NY Cantidad 4000 7000 6000 5000 Dependiente: Pago del prstamo A tiempo Tarde A tiempo Impago

Informacin adicional sobre redes neuronales

105

Se presentan a la red de la siguiente forma: Edad Estado= CT 0 1 0 0 Estado= NJ 0 0 1 0 Estado= NY 1 0 0 1 Cantidad Dependiente: Pago del prstamo A tiempo Tarde A tiempo Impago

41 32 54 37

4000 7000 6000 5000

106

Obras recomendadas
Los siguientes textos proporcionan informacin adicional sobre las redes neuronales que se usan en NeuralTools: Bishop, Christopher M., Neural Networks for Pattern Recognition, Oxford, 1995. Masters, Timothy, Advanced Algorithms for Neural Networks, Wiley, 1995. Reed, Russell D., Robert J. Marks, Neural Smithing, MIT, 1999.

Informacin adicional sobre redes neuronales

107

108

ndice

A
Administrador de conjunto de datos, 20 Arquitectura GRN, 98 Arquitectura MLF, 91 Arquitectura PNN, 101 Asignacin de variables, 65

D
Desinstalacin de NeuralTools, 7

E
Entrenamiento, 18 Entrenamiento de una red MLF, 93 Error cuadrtico medio, 63 Evolver, 32

B
Barra de herramientas NeuralTools, 39

H
Histograma de residuales, 63

C
Capacidad de conjuntos de datos y variables, 49 Comando Administrador de conjunto de datos, 43 Comando Administrador de red neuronal, 81 Comando Configuraciones de aplicacin, 77 Comando Entrenar, 50 Comando Predecir, 71 Comando Probar, 64 Comando Utilidades de reemplazo de datos, 83 Combinacin de entrenamiento, prueba y prediccin, 22 Cmo evitar el exceso de entrenamiento, 95 Comparacin de redes MLF y redes PN/GRN, 103 Conjuntos de datos, 20 Conjuntos de datos de rangos mltiples, 45 Conjuntos de datos y variables, 43 Cuadro de dilogo Administrador de conjunto de datos, 44 ndice

I
Iconos Escritorio, 8 NeuralTools, 39 Iconos de los cuadros de dilogo, 42 Informes de entrenamiento, 61 Informes de prueba, 28, 67 Instrucciones para la instalacin, 7

M
Matriz de clasificacin, 62

P
Palisade Corporation, 5 Prediccin, 18, 29 Prediccin en vivo, 30, 73 Previsualizacin de prediccin, 74 Previsualizacin de prueba, 66 Probar automticamente, 51 Problema numricos, ii Problemas de clasificacin, ii Progreso del entrenamiento, 60 Prueba, 18 109

R
Redes multinivel siempre hacia adelante, 55, 91 Redes neuronales de regresin generalizada, 23, 55, 97 Redes neuronales probabilsticas, 55, 100 Redes neuronales y mtodos estadsticos, 88 Requisitos del sistema, 6 Resmenes rpidos de los informes detallados, 70

StatTools, 32

T
Tiempo de ejecucin, 57 Tipo de variable, 47 Transformacin de valores de entrada, 105

V
Valores que faltan, 85 Variables de etiqueta, 48 Versin Profesional, iv

S
Solver, 32

110

También podría gustarte