Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería de datos
Inteligencia de negocios
Realizar análisis predictivos como parte del manejo empresarial de los datos, en
esencia, es estimar un resultado al observar patrones en los datos existentes. Se
puede hacer al elegir ciertas variables de un conjunto de datos, como
predictores. Se trata de definir los modelos para el análisis. Los datos para estos
predictores se ejecutan a través de un algoritmo estadístico de aprendizaje
automático, o Machine Learning, que evaluará, calificará y clasificará esas
variables para determinar la precisión de la salida.
Es posible que tengas que modificar tu modelo varias veces, y probar algunas
estrategias diferentes para aumentar la precisión. Pero afortunadamente, hay
muchas formas de hacerlo. El uso de Big Data como origen de datos, tanto para
el entrenamiento como para la validación de estos modelos, es altamente
recomendable.
Una de las formas que existen para realizar análisis exploratorio y estadístico, es
mediante Aprendizaje supervisado, donde se dividen los datos de muestra en
un conjunto de datos de entrenamiento y un conjunto de datos de prueba.
El conjunto de datos de entrenamiento se utiliza mientras se desarrolla el
modelo y el conjunto de datos de prueba se utiliza posteriormente para validar
la efectividad del modelo. Algunos ejemplos de algoritmos de aprendizaje
automático supervisado son: árboles de decisión, clasificación Naive
Bayes, regresión lineal o logística, máquinas de vectores de soporte o SVM. Otra
de las formas existentes es el Aprendizaje no supervisado, en el que no existe
un conjunto de datos de entrenamiento o prueba. Este modo de aprendizaje
será el más adecuado en escenarios de detección de anomalías o algún tipo de
agrupamiento. Algunos algoritmos comunes de agrupamiento son: Clustering,
K-means y KNN, también conocidos como vecinos más cercanos.
De esta forma, se obtienen los resultados del análisis exploratorio de datos para
descubrir valor, y el análisis estadístico de datos para comprender y mostrar la
evidencia del valor. Además, los modelos predictivos para ver cómo usar ese
valor para tomar decisiones empresariales informadas.
Es posible sacar buenas conclusiones a partir de modelos que
analizan conjuntos de datos tradicionales. Sin embargo, dado el caso, si
complementamos la información que tenemos con datos útiles, empleando
tecnología Big Data, será el mayor beneficio que podamos extraer a nuestros
modelos.
Inteligencia artificial
Aprendizaje automático
En los últimos años hemos visto una serie de grandes avances en el aprendizaje
automático o Machine Learning. Esto ha llevado a un nuevo tipo de aprendizaje
automático llamado aprendizaje profundo o Deep Learning, que ya es un hecho
en el presente y se prevé que sea el futuro de la inteligencia artificial.
El aprendizaje profundo es una forma de aprendizaje automático que acumula
múltiples capas de modelos de aprendizaje automático, uno encima del otro
para formar una jerarquía.
Las redes neuronales profundas son, significativamente, más potentes y
precisas en su detección de patrones, toma de decisiones y precisión de
predicción que la generación anterior de algoritmos de aprendizaje automático.
De hecho, estos algoritmos de aprendizaje profundo se están comportando con
mejores resultados que cualquier humano en el planeta en una variedad de
tareas mentales y físicas complejas. Como resultado de estos nuevos algoritmos
de aprendizaje profundo, probablemente reemplazarán a los
humanos encargados de tomar decisiones en una variedad de tareas en las
próximas décadas. Los avances recientes en el aprendizaje profundo han llevado
a la especulación de que podemos estar al borde de un gran avance en
informática, estadística y ciencia neuronal.
Ya sea que esto ocurra o no, las maquinas están a punto de volverse mucho
más inteligentes y cambiar nuestro mundo de muchas maneras. Veamos
algunos ejemplos de aplicaciones modernas de aprendizaje automático que
cada vez se superan más y más mejorando la capacidad de los humanos para
ciertas tareas. Primero, se han producido grandes avances en reconocimiento de
voz.
Los teléfonos inteligentes han mejorado notablemente su capacidad relativa al
reconocimiento de voz. Esto es posible gracias a algoritmos de aprendizaje
profundo que se aplican al reconocimiento de voz. Por otra parte, las
computadoras ahora pueden realizar la lectura de labios mejor que los
humanos. Y cuando se combinan con el reconocimiento de voz, mejora su
capacidad para reconocer con precisión los comandos especialmente en
entornos ruidosos, como los automóviles.
Esto se puede combinar con el procesamiento del lenguaje natural que
comprende la estructura de las oraciones, la gramática y el contexto para
permitir conversaciones similares a las de los seres humanos con las
computadoras. Y al aplicar la detección de sentimiento a las palabras que estás
diciendo combinadas con la detección de emociones en tu rostro, mientras las
pronuncias, la máquina puede, incluso, comprender el estado emocional en el
que te encuentras y responder de la forma más apropiada.
Como resultado, interactuar con las computadoras en un futuro
cercano probablemente se volverá mucho más fácil y más natural. Otro caso
muy interesante es sobre la generación de imágenes. Podemos usar los
algoritmos de aprendizaje automático para realizar la clasificación y regresión
de las imágenes, por ejemplo, al intentar predecir el género, la edad y el estado
emocional de una persona.
Sin embargo, lo que quizás no sepas es que las máquinas, ahora también son
excepcionalmente buenas para generar imágenes. Se entrenan al ver una gran
cantidad de imágenes de personas que envejecen a lo largo de los años. Como
resultado, aprenden cómo predecir los cambios en las características faciales
que se producen a medida que envejecemos, de modo que pueda aplicarlas a
nuevas imágenes que nunca han visto antes. Los resultados son mejores de lo
que la mayoría de los humanos podrían producir con el software de edición de
imágenes y probablemente mejores que la mayoría de los artistas de bocetos
de la policía.
Finalmente, la medicina; una de las áreas donde se prevé que el aprendizaje
profundo tendrá un impacto considerable es el mundo de la medicina. En el
pasado, el diagnóstico de afecciones médicas y las recomendaciones para los
tratamientos han sido responsabilidad de los médicos.
Los seres humanos únicamente. Sin embargo, en los últimos años los algoritmos
de aprendizaje profundo han asistido, incluso, a los mejores médicos del
mundo en una gran variedad de tareas médicas. Las máquinas ahora pueden
superar a los facultativos en varias áreas de diagnóstico, por ejemplo,
prediciendo la insuficiencia cardíaca hasta nueve meses antes que los médicos
que utilizan los medios tradicionales.
Ocurre lo mismo en la detección de lesiones cerebrales traumáticas, cáncer,
fracturas, sufrimiento fetal y otras afecciones médicas que se encuentran
utilizando diversas técnicas de imagen médica.
Además, estas máquinas ahora también superan a los médicos humanos en
varias áreas del tratamiento, por ejemplo, adaptando los planes de tratamiento
del cáncer basados en la genética individual para maximizar la probabilidad de
éxito en los efectos secundarios minimizados y las recomendaciones de
prescripción 1 para evitar los efectos secundarios potenciales y otras reacciones
adversas de usar combinaciones de drogas.
Todos estos ejemplos tienen un punto en común. Los datos necesarios para
todos estos procesos tienen estructuras y orígenes muy diversos, son muy
variables, crecen a gran velocidad y tienen gran volumen.
Se trata, sin dudas, de escenarios de uso de tecnologías Big Data, como base
para otras disciplinas tecnológicas del mundo de hoy.
Empecemos por recordar cómo era internet en sus inicios. Hace unas décadas,
teníamos internet en su versión más simple. Internet fue originalmente diseñado
para personas, fue diseñado para permitir a los humanos
comunicarse, colaborar e intercambiar información.
El coste para conectarse a internet fue relativamente alto. La velocidad de
nuestras conexiones a internet era lenta, el ancho de banda era bajo y se
conectaba a internet a través de cables físicos. Además, la web fue utilizada, en
gran medida, para consumir información. Producir nueva información para
internet era bastante difícil y requería bastante conocimiento técnico para crear
incluso una página web simple. La mayoría de los datos generados por
internet se recopilaron a través de formularios web básicos. Estos formularios
permitieron a las personas rellenar información básica como nombre, dirección,
número de teléfono y dirección de correo electrónico. Internet, realmente, no
generaba tantos datos.
Resumiendo, en el pasado, internet era caro, lento y no generaba tanta
información.
Pero esta situación afortunadamente cambió y ya tenemos lo que se conoce
como el internet de las cosas, IOT por sus siglas en inglés, que significa Internet
of Things. Hoy en día, internet ya no solo es para personas. El internet de las
cosas es la tendencia emergente de conectar todos los dispositivos, que son
cosas, a través de internet. También es una tendencia de conectar sensores que
monitorean objetos físicos, que también son cosas. Internet de las cosas está
siendo impulsado por la economía.
El costo de conectar un dispositivo a internet está disminuyendo, las
velocidades de conexión aumentan y el ancho de banda también aumenta; y las
conexiones inalámbricas ahora son abundantes y baratas. Esto significa que
ahora es rentable conectar dispositivos y sensores a internet para permitirles
recopilar y transmitir sus datos a la nube. Estos datos, cuando se analizan,
pueden crear un valor adicional que justifica el costo de internet al habilitar
estos dispositivos. Por ejemplo, conectar tu rastreador de ejercicios a internet te
permite realizar un seguimiento de tu ejercicio físico, patrones de sueño, ritmo
cardíaco y otra información vital.
Como resultado de la economía que impulsa al internet de las cosas, hemos
visto una explosión en el crecimiento de los dispositivos de IOT en la última
década. De hecho, se prevé que la cantidad total de dispositivos habilitados
para internet alcanzará los 50.000 millones de dispositivos para 2020, lo que
representa más de seis dispositivos conectados a internet para cada persona en
el planeta. Los dispositivos son muy variados.
A día de hoy, relojes, teléfonos y televisores inteligentes son algunos de los
ejemplos del internet de las cosas que están al alcance de la sociedad. Además
de los datos generados por los nuevos dispositivos y sensores de IOT, internet
de hoy también está obteniendo un valor adicional de la extracción de los
datos. Con el internet de las cosas, los datos que se generan a través de internet
ya no se limitan a simples formularios basados en la web. En cambio, las fuentes
de datos, ahora son dispositivos, sensores, actividades, audio, video, texto y
más. Enjambres de personas, dispositivos y sensores ahora generan un flujo
continuo de datos en la nube.
En resumen, hoy en día, el internet de las cosas es barato, rápido y genera
toneladas de datos. Generan Big Data, datos que pueden analizarse
utilizando las prácticas de la ciencia de datos para extraer nuevos valores y
perspectivas. Algunos expertos predicen que, en el futuro, internet se
convertirá en el internet de todo. La economía continuará impulsando
internet para convertirse en el internet de todo.
El costo de conectar a las personas, los dispositivos y los sensores continuará
disminuyendo, la velocidad seguirá aumentando, el ancho de banda se
ampliará y todo se volverá inalámbrico.
Como resultado, siempre que el valor derivado de los datos de un
dispositivo sea mayor que el costo para conectar el dispositivo a internet, habrá
un caso de negocio para habilitar internet en el dispositivo. Así que la mayoría,
si no todos los dispositivos, probablemente se conviertan en parte del internet
de las cosas. De hecho, en el futuro, es probable que una conexión a
internet sea tan común en los dispositivos como lo es la electricidad en la
actualidad. En este punto, es probable que todos los artefactos humanos estén
conectados a internet.
Esto significa que las fuentes de datos son esencialmente algo importante en
nuestro mundo.
Todas las personas, dispositivos, edificios, ciudades, etcétera., esencialmente se
convierten en una fuente de datos para ser analizados, lo que significa que
habrá más y más Big Data.