Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ensayo
Docente de Cátedra
Estadística Inferencial
El medio donde nos desenvolvemos nos impacta a cada instante con multitud de
información que nuestro cerebro debe estar en capacidad de procesar con el fin de
poder tomar decisiones adecuadas.
En este momento, con el uso extensivo de Internet, las personas y las organizaciones se
ven abrumadas con la información y de ello surge un verdadero reto: el procesamiento
de esa información.
Actualmente, en los países desarrollados se está llevando a cabo un nuevo uso de los
grandes volúmenes de información para lo cual se han desarrollado nuevas técnicas y
nuevo soporte a nivel de software y hardware.
Los estrategas están siendo apoyados por “programas” que procesan de manera
“inteligente” los grandes volúmenes de información sobre un negocio en particular y
convierten estos cúmulos de información en modelos disponibles en el sistema de
información de la organización para que soporten las decisiones estratégicas.
Esta forma “automatizada” de procesar los datos cuenta con procedimientos para
analizar y transformar los datos nulos, extremos y los datos no balanceados. También
tiene previstos procedimientos para convertir variables numéricas en categóricas o
categóricas en numéricas.
Los algoritmos genéticos son métodos numéricos de optimización que aplican las reglas
de la evolución biológica: la reproducción sexual y la mutación.
Entre tanto, la inteligencia artificial incluye los sistemas expertos, los sistemas
inteligentes y las redes neuronales.
Los sistemas expertos son algoritmos creados a partir de reglas practicas extraíbles del
conocimiento de expertos. Principalmente a base de inferencias o de relaciones causa-
efecto.
Los sistemas inteligentes son algoritmos iguales a los sistemas expertos, pero con
mecanismos para afrontar situaciones desconocidas.
La plataforma que hace posible que una institución puede implementar minería de
datos es:
1. La creación de Almacenes de datos o Data Ware-house los cuales son una colección
de datos enmarcados en un determinado ámbito institucional
2. El manejo de metadatos, es decir, datos acerca de los datos tales como tablas,
columnas de tablas, relaciones entre tablas, jerarquías, dimensiones de datos,
entidades y relaciones
3. La disponibilidad de funciones ETL o funciones de extracción, transformación y
carga de bases de datos
4. Accesibilidad a Middleware o software de conectividad que hacen posible el
funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas y que
garantiza la conectividad
5. Disponibilidad de software de minería de datos