Está en la página 1de 6

EL FUTURO DE LA ESTADÍSTICA

Ensayo

Beatriz García Peña

Docente de Cátedra

Universidad Colegio Mayor de Cundinamarca

Estadística Inferencial

Programa Administración de Empresas Comerciales

Bogotá, 11 de agosto de 2009


EL FUTURO DE LA ESTADÍSTICA

El medio donde nos desenvolvemos nos impacta a cada instante con multitud de
información que nuestro cerebro debe estar en capacidad de procesar con el fin de
poder tomar decisiones adecuadas.

A su vez, el entorno de las organizaciones en las cuales laboramos está cambiando


constantemente y, como resultado, emitiendo datos que requieren convertirse en
información útil para garantizar al menos la permanencia de aquellas.

El ciclo administrativo de la planeación, gestión, verificación y retroalimentación en el


que están inmersas las instituciones que persiguen el mejoramiento constante y la
concepción de la institución como una organización con cultura de calidad, requiere el
seguimiento de variables y el cálculo de indicadores que expresen atributos susceptibles
de recibir valoración cuantitativa y/o cualitativa. Este seguimiento se realiza a través del
tiempo y se centraliza y estandariza en sistemas de información de gestión.

Estos esfuerzos de sistematización y utilización de la información se deben adelantar de


manera óptima consultando los requerimientos de los tomadores de decisiones y los
recursos informáticos al nivel del recurso humano - profesionales y tecnólogos en
ingeniería de sistemas - y de recursos de software y hardware disponibles en la
institución. Su éxito también depende de una cultura organizacional que privilegie la
calidad, la gestión y la consolidación de la información.

En este momento, con el uso extensivo de Internet, las personas y las organizaciones se
ven abrumadas con la información y de ello surge un verdadero reto: el procesamiento
de esa información.

Adicionalmente, la disponibilidad en el mercado de procesadores cada vez con mayor


capacidad y a menor precio han creado las condiciones tecnológicas adecuadas para la
utilización intensiva de los recursos informáticos en el ámbito empresarial.

Tradicionalmente, las organizaciones contaban con equipos interdisciplinarios que


asesoraban a los tomadores de decisiones en la interpretación del contexto y en la
formulación de la planeación estratégica de la organización, precisando amenazas,
oportunidades, fortalezas y debilidades. La organización, de esta manera, aseguraba su
sobrevivencia y en lo posible su crecimiento y fortalecimiento.

Actualmente, en los países desarrollados se está llevando a cabo un nuevo uso de los
grandes volúmenes de información para lo cual se han desarrollado nuevas técnicas y
nuevo soporte a nivel de software y hardware.

BEATRIZ GARCIA PEÑA, MSC. EN CIENCIAS, ESTADISTICA 2


EL FUTURO DE LA ESTADÍSTICA

Los estrategas están siendo apoyados por “programas” que procesan de manera
“inteligente” los grandes volúmenes de información sobre un negocio en particular y
convierten estos cúmulos de información en modelos disponibles en el sistema de
información de la organización para que soporten las decisiones estratégicas.

Es así como la minería de datos o data mining automatiza el proceso de encontrar


información predecible en grandes bases de datos, logrando “predicción automatizada”
de tendencias y comportamientos y “descubrimiento automatizado” de modelos. Por
ejemplo, utilizando datos extremos y atípicos se pueden predecir modelos de usuarios
fraudulentos o usuarios próximos a prescindir de los servicios ofrecidos en una
institución dada.

Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la


solución de problemas de predicción, clasificación y segmentación de manera
“automatizada”, es decir, los programadores han desarrollado software con algoritmos
que reproducen los mecanismos de aprendizajes de los seres humanos - relaciones
causa efecto, inferencia, seguimiento a secuencias de sucesos - o algoritmos que
siguiendo las reglas de la biología y la genética; optimizan los complejos problemas
administrativos.

En términos generales, un proceso típico de minería de datos incluye: la comprensión


del negocio y del problema que se quiere resolver, la selección del conjunto de datos, el
análisis de las propiedades de los datos y la transformación del conjunto de datos de
entrada.

Esta forma “automatizada” de procesar los datos cuenta con procedimientos para
analizar y transformar los datos nulos, extremos y los datos no balanceados. También
tiene previstos procedimientos para convertir variables numéricas en categóricas o
categóricas en numéricas.

Posteriormente se selecciona y aplica la técnica de minería de datos construyendo un


modelo predictivo, de clasificación o de segmentación. La validación del modelo se
realiza utilizando un conjunto de datos previamente reservados para este fin y
corroborando que proporciona salidas adecuadas y/o márgenes de error admisibles.

Es en este punto en el cual el modelo de minería de datos se implementa en el sistema


de información de la organización.

En los estudios de minería de datos se utilizan bases de datos estructuradas y


desestructuradas. Ejemplos de estas últimas son los ficheros de texto, la información
resultante de una consulta en internet mediante buscador.

BEATRIZ GARCIA PEÑA, MSC. EN CIENCIAS, ESTADISTICA 3


EL FUTURO DE LA ESTADÍSTICA

La minería de datos resulta de la consolidación de la Informática y de la Estadística.


Los principales algoritmos procedentes de la informática y utilizados en minería de
datos son: los algoritmos genéticos y los algoritmos de inteligencia artificial.

Los algoritmos genéticos son métodos numéricos de optimización que aplican las reglas
de la evolución biológica: la reproducción sexual y la mutación.

Entre tanto, la inteligencia artificial incluye los sistemas expertos, los sistemas
inteligentes y las redes neuronales.

Los sistemas expertos son algoritmos creados a partir de reglas practicas extraíbles del
conocimiento de expertos. Principalmente a base de inferencias o de relaciones causa-
efecto.

Los sistemas inteligentes son algoritmos iguales a los sistemas expertos, pero con
mecanismos para afrontar situaciones desconocidas.

Las redes neuronales son un paradigma de aprendizaje y procesamiento automático


inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de
un sistema de interconexión de neuronas en una red que colaboran para producir una
salida. Son modelos predecibles no-lineales que aprenden a través del entrenamiento
por semejanza.

La minería de datos también utiliza técnicas procedentes de la estadística como los


arboles de decisión, el análisis de varianza, las pruebas chi-cuadrado, el análisis
discriminante, el análisis de agrupamiento, las series de tiempo y los modelos de
regresión.

En este nuevo contexto, un árbol de decisión es un modelo de predicción utilizado en


el ámbito de la inteligencia artificial, que procesa una base de datos construyendo un
diagrama de construcciones lógicas muy similares a los sistemas de predicción basadas
en reglas, que sirven para representar y categorizar una serie de condiciones que
suceden de forma sucesiva para la solución de un problema administrativo.

La minería de datos se ha extendido a la minería de textos, de datos espaciales y de


sitios web. Esta última se centra en modelar el contenido de los sitios web, en
categorizar sus estructuras de enlaces y en hacer un seguimiento a los usuarios que
navegan en determinados sitios web.

BEATRIZ GARCIA PEÑA, MSC. EN CIENCIAS, ESTADISTICA 4


EL FUTURO DE LA ESTADÍSTICA

La plataforma que hace posible que una institución puede implementar minería de
datos es:
1. La creación de Almacenes de datos o Data Ware-house los cuales son una colección
de datos enmarcados en un determinado ámbito institucional
2. El manejo de metadatos, es decir, datos acerca de los datos tales como tablas,
columnas de tablas, relaciones entre tablas, jerarquías, dimensiones de datos,
entidades y relaciones
3. La disponibilidad de funciones ETL o funciones de extracción, transformación y
carga de bases de datos
4. Accesibilidad a Middleware o software de conectividad que hacen posible el
funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas y que
garantiza la conectividad
5. Disponibilidad de software de minería de datos

En la actualidad, en el mercado del software existen módulos especializados en minería


de datos desarrollados por SPSS y SAS. También existen paquetes especializados en
estas técnicas como Pimienta y Weka, este último con una característica muy apetecible
por ser un software de acceso libre.

Algunas tendencias llevan la minería de datos hasta la inteligencia empresarial,


concebida ésta como el conjunto de estrategias y herramientas enfocadas a la
administración y creación de conocimiento mediante el análisis de datos existentes en
una organización o empresa.

Actualmente la minería de datos se aplica a la administración empresarial para modelar


las relaciones con los clientes, para descubrir los hábitos de compra en los
supermercados, para determinar los patrones de fuga, para precisar usuarios
fraudulentos, para descubrir el comportamiento de los usuarios de Internet, etc.
Este acercamiento a los usos actuales de la estadística en procesos automatizados nos
enfrenta en los niveles personal, profesional e institucional a cuestionarnos qué tan
preparados estamos para enfrentar los desafíos que implican estos desarrollos.

Vivimos en una época en la cual el procesamiento de los grandes volúmenes de


información es la clave para obtener una ventaja competitiva, ¿somos por lo menos
conscientes de esta realidad?
¿Estamos al menos informados de los nuevos usos de la estadística y de la informática?,
¿estamos preparando a nuestros estudiantes para que puedan manejar este tipo de
procesos en su calidad de administradores futuros de organizaciones? ¿y la institución

BEATRIZ GARCIA PEÑA, MSC. EN CIENCIAS, ESTADISTICA 5


EL FUTURO DE LA ESTADÍSTICA

en la cual laboramos está preparándose para emprender el camino de los negocios


inteligentes?

El “aprendizaje automatizado” nos sitúa en un nuevo paradigma. Nuestro deber, llegar


a ser capaces de desempeñarnos en consecuencia y adecuadamente.

BEATRIZ GARCIA PEÑA, MSC. EN CIENCIAS, ESTADISTICA 6

También podría gustarte