Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ARTIFICIAL Y SUS
APLICACIONES
Material original de ENyD BUSINESS SCHOOL. Permitido su uso en
programas de postgrado durante el presente curso.
Autor: Fernando Doral Fábregas
1
Índice de contenido
1. INTRODUCCIÓN 3
2. EL ANÁLISIS DE DATOS 8
4. CONCLUSIONES 20
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
5. BIBLIOGRAFÍA 21
2
1. INTRODUCCIÓN
En muchos casos, es muy probable que toda la información, o al menos la clave para
la gestión y mejora de la empresa, ya se encuentre en poder de ésta. De hecho una
de las particularidades del big data es que se hace un uso de información que no
3
necesariamente se planificó cuando ésta se recopiló (Mayer-Schönberger y Cukier,
2014). La explotación de dicha información se revela por tanto como uno de los
grandes potenciales de optimización de las compañías.
Las empresas necesitan, por una parte profesionales capaces de integrar y recopilar
toda esa información: científicos de datos (“data scientitst”) que generarán
volúmenes ingentes de datos que deberán ser explotados. Pero además, al nivel de la
gestión empresarial, será necesario contar con personas que, en primer lugar
conozcan las herramientas de tratamiento de datos para saber las posibilidades que
ofrecen y las limitaciones que tienen. En segundo lugar, sean capaces de utilizar esa
información para apoyar decisiones empresariales sólidas y bien fundamentadas.
Un caso de éxito.
Dos semanas más tarde, el director volvió a llamar al hombre para disculparse
nuevamente. Y para su sorpresa, el padre de la adolescente le notificó que “en
su casa estaban ocurriendo cosas que él desconocía”, y fue él quien se disculpó
con el director de la tienda. Target había acertado en el diagnóstico, incluso
antes de que el padre de la joven tuviera noticia del embarazo.
4
entendimiento, hace que los usuarios y los gestores empresariales se vean abrumados
por multitud de datos, no siempre fundamentales para el desarrollo. El control de este
exceso de información es por tanto otro de los factores clave en una correcta gestión
de los datos, dado que obviamente van a seguir en aumento y afectando a todas las
áreas de la empresa.
1. Extracción de los datos. El primer paso será identificar las fuentes de datos
que puedan servir para tomar conclusiones válidas. En el ejemplo de la
empresa Target, incluso tan enfocados en una única fuente (los hábitos de
consumo) el hecho de identificar las variables que permitían decidir si una
mujer estaba o no embarazada, fue un hito relevante y no al alcance de
cualquier estadístico. Con ello se deben componer las estructuras que
Original de ENyD BUSINESS SCHOOL. Permitido su uso en programas de postgrado durante el presente curso.
alberguen los datos que se tomarán como base para la toma de decisiones. La
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
5
Ilustración 1. Áreas de aplicación de la ciencia de datos
Los perfiles para las cuatro fases van variando con respecto a su exigencia en cuanto
a conocimientos técnicos y de estrategia empresarial. Las primeras fases
Original de ENyD BUSINESS SCHOOL. Permitido su uso en programas de postgrado durante el presente curso.
6
Como vemos, el funcionamiento ideal del proceso se basa en un constante y óptimo
flujo de comunicación y coordinación entre las distintas disciplinas.
7
2. EL ANÁLISIS DE DATOS
8
Ciencia de datos. En los orígenes de la informática, los datos se almacenaban
en estructuras jerárquicas y perfectamente estructuradas. En la actualidad, con
la proliferación de distintas fuentes que deben combinarse, los datos raramente
se encuentran estructurados. La ciencia de datos se encarga de gestionar el
almacenamiento de los datos hasta conseguir ofrecerlos de manera que sea
factible analizarlos.
Analítica de datos. Toma como entrada los datos proporcionados por los
científicos de datos y los transforman en información. Esta información se
pone a disposición de las personas que toman las decisiones en las empresas y
organizaciones, para que sirva de soporte a sus decisiones.
Original de ENyD BUSINESS SCHOOL. Permitido su uso en programas de postgrado durante el presente curso.
Los sistemas han evolucionado hasta imitar no sólo la forma en que actúan los
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
humanos, sino también el modo en que razonan. Los sistemas que emulan el
comportamiento del cerebro humano se estudian en la siguiente matriz.
La matriz se divide en dos ejes. Por un lado el modo en que proceden los sistemas: si
se limitan a razonar de manera lógica o van un paso más allá emulando el
9
comportamiento del cerebro humano, incluso sobrepasando el nivel estrictamente
lógico. Por otro la actividad en la que se enfocan: pensar o actuar.
Se trata de los sistemas que trabajan como las personas, en forma de estímulo
reacción. En este caso es sencillo que los sistemas se comporten como
humanos ante los estímulos programados.
10
Ilustración 4. El test de Turing
Original de ENyD BUSINESS SCHOOL. Permitido su uso en programas de postgrado durante el presente curso.
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
11
3. Robots inteligentes. Es una de las áreas en las que los sistemas
computerizados han tenido mayor aportación, dado que la sustitución de
personas por robots para algunas tareas, han mejorado al eliminar factores
indeseables como el cansancio, el aburrimiento o la falta de precisión. Así, han
resultado ideales para llevar a cabo tareas repetitivas, muy exigentes en
cuanto a precisión, o que entrañen peligro.
12
Ilustración 5. Características de la era del big data
Original de ENyD BUSINESS SCHOOL. Permitido su uso en programas de postgrado durante el presente curso.
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
2- Seleccionar los datos. Una vez se tenga claro el problema que se quiere
resolver, se procederá a seleccionar los datos que se pueden explotar para
conseguir la información requerida. Ello conlleva definir cuáles son las variables
13
que se pretenden analizar, así como el modo de conseguir los valores de dichas
variables.
del esfuerzo y del tiempo del proyecto, dado que con frecuencia los datos en
bruto no son directamente explotables. Habitualmente se requerirá un trabajo
dirigido a eliminar o gestionar los registros anómalos que se hayan detectado.
14
Algoritmos de redes neuronales. Como se dijo anteriormente, se
trata de algoritmos que emulan el comportamiento de la red de
neuronas del cerebro humano, reproduciendo de manera artificial el
entramado de elementos y conexiones.
15
3. TIPOS DE PROYECTOS DE
ANÁLISIS DE DATOS
Existen distintas maneras de clasificar los tipos de proyectos que se pueden llevar a
cabo en el área del análisis de datos. La más frecuente es por el funcionamiento, que
divide los proyectos en supervisados o no supervisados. A continuación analizamos
ambos tipos de proyectos.
Los proyectos de aprendizaje supervisado son aquéllos en los que los modelos se
entrenan con conjuntos de datos cuya clasificación como “correctos” o “incorrectos” se
conoce de antemano. El siguiente ejemplo muestra un esquema de cómo podría
trabajar un sistema de aprendizaje supervisado para una empresa de seguros.
16
En el ejemplo, la empresa aseguradora desea ajustar la prima que cargará a un
cliente, o decidir si admite o no su cobertura. Para ello, previamente necesitará
calcular cuál es el índice de riesgo que comporta ese cliente específico. Para resolver
este problema, probablemente utilizará un modelo que tome como entrada los datos
de otros clientes con relación a una serie de datos (denominadas variables
independientes) y su correspondiente clasificación como cliente potencial. El sistema
aprenderá a partir de los datos proporcionados, cuya puntuación se conoce, para en
adelante ser capaz de puntuar a los nuevos clientes que se presenten.
17
los resultados de la regresión y establecería un umbral mínimo. Por ejemplo
podría establecer como umbral mínimo una puntuación de 50, en cuyo caso el
elemento propuesto como ejemplo resultaría clasificado como “aceptable”.
Uno de los usos más frecuentes es el clustering. Se trata de una técnica que recibe
como entrada una serie de elementos con distintos valores en diferentes
características. A partir de esos datos, el sistema busca similitudes y diferencias, y con
ello agrupa los elementos buscando que cada grupo o cluster contenga individuos que
18
se parezcan al máximo entre sí, y sean lo más diferente posible con los integrantes de
los demás grupos.
19
4. CONCLUSIONES
que teóricamente no habría sido tenido en cuenta como determinante para calcular el
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
20
5. BIBLIOGRAFÍA
Caballero Roldán, Rafael; Martín Martín, Enrique (2015). Las bases del big data.
Madrid, Catarata.
Mayer-Schönberger, Viktor; Cukier, Kenneth (2014). Aprender con big data. Madrid,
Turner Publicaciones.
Raj, Pethuru; Poongodi, T.; Balamurugan, Balusamy; Khari, Manju (2020). The
Original de ENyD BUSINESS SCHOOL. Permitido su uso en programas de postgrado durante el presente curso.
Internet of Things and Big Data. Boca Raton (FL), CRC Press.
Prohibida su reproducción total o parcial sin la autorización expresa de ENyD BUSINESS SCHOOL.
21