Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnologías, protocolos y
lenguajes en internet
INDICE
BLOQUE I. INTRODUCCIÓN INTERNET DE LAS COSAS .................................................................................................... 3
INTRODUCCIÓN ..................................................................................................................................................................... 3
Desafíos Big Data .......................................................................................................................................................... 7
1.1. Entendimiento del Negocio ............................................................................................................................... 7
1.2. Infraestructura y tecnología existente. ............................................................................................................. 8
1.3. Definición de arquitectura ................................................................................................................................ 9
2. PROTOCOLOS DE COMUNICACIÓN MÁS UTILIZADOS ............................................................................................................. 10
2.1. Tecnologías WAN ............................................................................................................................................ 11
2.2. Tecnologías LAN/PAN ..................................................................................................................................... 13
2.3. Sensores LAN/PAN .......................................................................................................................................... 17
2.4. Sensores WAN/MAN ....................................................................................................................................... 19
3. HERRAMIENTAS Y LENGUAJES DE PROGRAMACIÓN SEMÁNTICA EN INTERNET. ........................................................................... 26
3.1. Introducción .................................................................................................................................................... 26
METADATOS ....................................................................................................................................................................... 29
1.1.1. ONTOLOGÍAS ...................................................................................................................................................... 30
1.1.2. COMPONENTES ................................................................................................................................................... 30
1.1.3. AXIOMAS ........................................................................................................................................................... 31
1.1.1. REDES SEMÁNTICAS .............................................................................................................................................. 32
1.1.1. BÚSQUEDA SEMÁNTICA ......................................................................................................................................... 36
3.2. Primeros lenguajes semánticos. ...................................................................................................................... 38
3.3. Lenguajes ontológicos basados en la web. ..................................................................................................... 40
3.4. Herramientas Ontológicas. ............................................................................................................................. 51
3.5. Herramientas XML .......................................................................................................................................... 55
MBIGDA_M4T1_160901
2
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Dicha evolución hoy en día, es un atractivo importante para lo que se viene en concepto de
ciudades inteligentes, donde lo que se busca principalmente es mejorar el estilo de vida de las
personas y ayudar a los gobiernos a utilizar mejor sus recursos, optimizando gastos, aplicando los
fondos en darle solución a sectores más carenciados, etc. Por otro lado, en el sector privado, las
empresas grandes, medianas ya ven un atractivo importante, para analizar gustos, costumbres
detectando patrones sociales que los ayude a decidir y mejorar su rentabilidad, gestionar mejor sus
recursos.
La tecnología Big data, tiene un masivo alcance que se hace imposible analizar exhaustivamente el
ámbito de aplicación, dicho esto, tomaremos algunos ámbito de uso que serán de ejemplo para
determinar las bondades que tiene.
MBIGDA_M4T1_160901
3
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
A continuación citamos los más importantes de uso general con algunos proyectos IoT de ejemplo.
o Control eléctrico, sensores en tiempo real que detectan cortes o bypass en cables
de alta tensión, caídas de postes, etc.
Hogares
MBIGDA_M4T1_160901
4
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Industria y producción.
Medio ambiente
Salud y bienestar
o Aplicaciones para detectar nivel anímico de las personas, a los efectos de enviar
alertas en tiempo real de posibles brotes o depresiones y que estos sean asistidos
en forma inmediata.
MBIGDA_M4T1_160901
5
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Internet de las cosas (IoT) trata la interconexión en tiempo real de todo lo que hoy conocemos
como dispositivos móviles o recolectores de datos como sensores, los cuales son transmitidos a
través de internet, sin importar el formato o volumen que este tenga. De hecho, aquellas empresas
que no utilicen internet como medio de interconexión dejarán de existir en el futuro, con lo cual
tendrán que evolucionar y hacer uso de nuevas tecnologías para ser más competitivos.
Uno de los desafíos más grandes para lograr esto es atacar los cuatro problemas derivados del
análisis de la información en las web, estas es:
El manejo de grandes volúmenes de datos, lo que deriva en contar con los recursos de
hardware necesarios a tal fin.
Por último, y no menos importante, la veracidad de los datos, ya que la ardua tarea de
procesar y depurar tiene que ser hecha con datos verídicos y reales, es obvio lo que esto
implica, tomar decisiones acertadas y que no redunde en errores más graves o
consecuencias nefastas en los negocios.
MBIGDA_M4T1_160901
6
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Big data, surge como un paradigma de moda, consecuencia del desmadre en el aumento de la
información que se va a dar año tras año y es la clave para dar paso a una segunda etapa en al
análisis de la información en la web denominada web semántica.
En síntesis, este módulo pretende dar una visión completa y lo más detallada posible lo que
implica analizar la web de los datos mediante las nuevas tecnologías como lo es Big data.
El entorno de trabajo, será en gran medida la gran nube de internet, lo que nos lleva a una
limitación obvia, como procesamos grandes volúmenes, dada las limitaciones físicas de hardware,
la solución es simple, además de antigua, es mediante la distribución de recursos de hardware, con
lo cual Big data hace uso de diversas plataformas de hardware para lograr el procesamiento de la
información en tiempo real.
El conocimiento de los que es IoT ( Internet of Thinks), nos abre la posibilidad de plantear otros
modelos de negocio a partir de la colección de datos y el advenimiento de nuevos dispositivos y
sensores inalámbricos o por radio frecuencia. Por ejemplo, citamos el caso de ciudades inteligentes
donde se podría automatizar el riego de las plazas y zonas de vegetación para mejorar la calidad del
aire, mediante la implementación de dispositivos de detección de humedad, temperatura o la
implementación de sensores de caudalímetros en los canales y ríos a los efectos de predecir
MBIGDA_M4T1_160901
7
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
sequias o inundaciones, es decir, el uso de esta nueva tecnología abiertas “Open Data”, disponible
al público en general, da nuevas oportunidades de negocio mediante IoT.
Una visión general de IoT es posible ilustrar clasificando los dispositivos de recolección de datos
que hoy existe, los que no abre otra puerta de conocimiento que se centra en las comunicaciones y
en especial en los protocolos de comunicación.
MBIGDA_M4T1_160901
8
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
fácil implementación y cuenta con leguajes semánticos para el análisis de datos web. Otra de las
herramientas que está sustituyendo a Hadoop se denomina “Spark” lo que permite el manejo de
paralelismo de procesos en múltiples máquinas al mismo tiempo, además de incorporar lo que ya
trae su antiguo predecesor en materia de base de datos distribuidas. Spark, cuenta además con la
posibilidad de trabajar en clúster con miles de PC interconectadas entre si y compartiendo recursos
en forma simultáneas sin que se degrade la performance en la comunicación de datos entre los
equipos.
Una de las tecnologías que utiliza Spark para lograr esto último, se denomina RDD ( Resilent
Distributed Data), el cual tiene la capacidad de generar colecciones de datos distribuidos a partir de
la programación de objetos generado por el programador, el cual, tiene efecto a nivel de procesos
en forma simultánea en todos los equipo donde corre el proceso. Su implementación se basa en
generar funciones que son desarrolladas y que se encargan de transformar la información. Dicha
tecnología fue desarrollada inicialmente por Google y fue acuñada con el nombre de “MapReduce”
o filosofía de los datos.
Una de las ventajas importante de usar esta tecnología es la seguridad ya que su funcionalidad
está garantizada por más que alguno de sus nodos deje de funcionar, ya que distribuye en forma
automática su carga de trabajo en el resto de sus nodos o equipos.
MBIGDA_M4T1_160901
9
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
procesamiento pero además nos da una clara ventaja en cuanto al mantenimiento y abstracción de
la tecnología utilizada. Por si todo esto fuera poco, es posible montar el software más conveniente
para el manejo de tecnología Big data y contratar los servicios extras a la nube tales como alquiler
de datos en materia de redes sociales, colectores de datos de sensores públicos como por ej., RFID
de tráfico, estados del tiempo, etc. En claro que cuando no contamos con los recursos necesarios
para analizar cierta información y poder decidir sobre un tema, es posible alquilar dichos recursos
por un tiempo hasta lograr el resultado que nos servirá en la toma de decisión.
Para abordar cuestiones que tiene que ver con la recolección de datos, tendremos que
conocer algunos conceptos basado en la teoría de comunicaciones y protocolos más utilizados en
internet. A continuación se ilustra el rango y variedad de tecnologías que existen para
interconectar las cosas, las cuales abordaremos para su entendimiento.
Tecnolog ía de comun icac ión u tilizada según rango de comu nicac ión
MBIGDA_M4T1_160901
10
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Uno de los medios físicos de más uso en la actualidad, son los dispositivos móviles utilizan
medios inalámbricos de comunicación conocido como protocolos 3G/4G LTE.
Por otra parte, en el año 2012, se modificó dicho protocolo para que trabaje multi-banda
dando la posibilidad de interactuar con la vieja tecnología 2G/3G.
En cuanto a las características técnicas y prestaciones que ofrece 4G LTE podemos citar:
MBIGDA_M4T1_160901
11
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Frecuencias o bandas disponibles: en USA las bandas son 700, 850, 1700 y 2600
MHz, mientras que en Europa y el resto del mundo es de 800,900, 1800 y 2600
MHz.
3G
MBIGDA_M4T1_160901
12
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
2G/GPRS/EDGE/GSM
Wi-Fi
Es una red, basada en el estándar de intercambio de datos inalámbrico, IEEE 802.11. Una de las
grandes ventajas de usar este tipo de protocolo de comunicación es su compatibilidad con las redes
nativas IP, lo que da lugar a otras ventajas como la estandarización de desarrollos y soluciones
mediante la transmisión / recepción de paquetes IP.
Hoy en día, cualquier dispositivo móvil o sensor colector de datos tiene asociado este tipo de
protocolo como alternativa de comunicación de bajo costo, lo que garantiza su implementación en
forma efectiva, obviamente hay que tener en cuenta como se mencionó anteriormente que solo
MBIGDA_M4T1_160901
13
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
funciona para distancias cortas y teniendo en cuenta factores climáticos que no afecten la
comunicación aérea.
IEEE 802.15.14
MBIGDA_M4T1_160901
14
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
ZIGBEE
Z-WAVE
Protocolo de comunicación diseñado específicamente para uso en domótica del hogar o negocios.
En cuanto a su arquitectura de funcionamiento está compuesto por un emisor de radio frecuencia
de bajo consumo que permite la interconexión entre varios dispositivos de similares características
formando una red mallada. Dentro de las prestaciones y ventajas que presenta este tipo de
protocolo es:
No requiere cableado.
Fácil de instalar
Gran variedad de dispositivos y sensores de control y recolección de datos.
Muy seguros, sin pérdidas de datos.
MBIGDA_M4T1_160901
15
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Bluetooth
MBIGDA_M4T1_160901
16
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
RFID
MBIGDA_M4T1_160901
17
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
NFC
Protocolo de comunicación basado en radio frecuencia de corto alcance, muy similar al RFID, el
objetivo de este protocolo es genera campos electromagnéticos de muy corto alcance para que no
sea interceptado.
Una de las ventajas que presenta este tipo de sensor es que es posible programar la codificación y
transferencia de los datos y su costo en muy bajo, además de ser prácticamente diminuto el sensor
físico para su implementación.
Su campo de aplicación es muy amplio, desde monedero electrónico, teléfonos para pago,
identificación de documentos, etc.
MBIGDA_M4T1_160901
18
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
ANT / ANT+
La versión mejorada ANT+ ofrece prestaciones específicas según su uso, por ej. en la medicina
se utiliza en los marcapasos o en las industrias como en la robótica de producción. Otro campo de
aplicación es la auto navegación de vehículos en autopistas o rutas.
MBIGDA_M4T1_160901
19
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Redes MAN ( Metropolitan Área Network): son redes consideradas un mix entre
WAN/LAN, es decir, el rango de cobertura es local y a su vez puede abarcar varias
manzanas. Este tipo de redes a diferencia de las WAN pueden pertenecer a una
empresa u organización.
Los protocolos de comunicación diseñados para este tipo de redes apuntan al concepto de
ciudades inteligentes en el cual se desarrolla y diseñan métodos de optimización en la recepción
y transmisión de los datos. Dentro de las tecnologías más destacadas podemos citar:
Wimax
Protocolo de comunicación inalámbrico basado en el estándar IEEE 802.16 y está diseñado para
enlaces sin línea de visión directa (NLoS) entre el emisor y el receptor, lo cual, lo hace muy útil en
entornos urbanos donde hay una gran densidad de población.
Este tipo de tecnología es costoso debido a la complejidad de los niveles de frecuencia y análisis en
la transferencia de datos, es decir cuenta con cierta inteligencia para mejorar el rendimiento,
velocidad y potencia de transmisión.
MBIGDA_M4T1_160901
20
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Weightless
Tecnología de comunicación inalámbrica de última generación orientada a M2M (Maquina a
Maquina), cuenta con tres características fundamentales, bajo costo, bajo consumo y buena
propagación de las ondas para aumentar el rango de trabajo.
Existen dos versiones de esta tecnología, denominada “Weightless –W”, que usa la frecuencia de
ruido blando de las señales de TV y la versión “Weightless-N” que usa la banda de frecuencia ISM,
su alcance promedio es de hasta 5 KM y tiene una autonomía de 10 años aproximadamente.
En cuanto a su arquitectura, está diseñado para modular la frecuencia al punto de máxima
penetración y propagación en edificios y estructuras sólidas.
Dash7
Protocolo de comunicación inalámbrica de baja potencia y rango medio, se basa en el modelo
BLAST, que consiste en:
Bajo Costo.
MBIGDA_M4T1_160901
21
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Este tipo de tecnología de última generación, es superior a Wifi, ZigBee y tecnologías RFID activas.
En cuanto a su uso, podemos citar detección de plazas libres de estacionamiento, posicionamiento
de objetos en movimiento, tropas de animales, etc.
ENOCEAN
MBIGDA_M4T1_160901
22
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
PLC
MBIGDA_M4T1_160901
23
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
ETHERNET
Tecnologías de red de transmisión por cable, ya sean de cobre, coaxial o fibra óptica. A día
de hoy se considera la tecnología dominante en transmisión de datos a nivel mundial aunque poco
a poco comienza a desplazarla las tecnologías WiFI.
Las principales ventajas de esta familia son las altísimas velocidades de transmisión posibles y las
largas distancias que es capaz de cubrir, todo ello siendo muy resistente a las interferencias (gracias
al blindaje de los cableados o las propias características de la transmisión de ondas lumínicas).
Sin embargo, los principales puntos débiles de esta tecnología tales como la falta de movilidad y
dificultad de instalación (necesario tendido de cableado) hacen que su aplicación en IoT quede
limitado a aquellas aplicaciones que requieran un muy alto ancho de banda o la seguridad que
proporciona el cableado físico.
MBIGDA_M4T1_160901
24
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MBIGDA_M4T1_160901
25
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
3.1. Introducción
En sus orígenes la web fue mutando y evolucionando constantemente, desde la Web 1.0
que solo permitía que las personas sean observadoras de contenido, hacia la Web 2.0 que permite
que los usuarios interactúen y colaboren entre sí en una comunidad virtual para generar
conocimiento, luego se abrió paso la Web 3.0 que tiene como característica más importante la
Web Semántica, incluso se habla de la Web 4.0 que abre el camino hacia una red ubicua (R. Want,
1995). Junto con la evolución de la web, grandes cantidades de datos se generan día a día, es aquí
donde nace el término “Big Data” que es visto como una oportunidad y reto para investigar en el
volumen, velocidad y variedad de datos. Por otra parte hay que destacar el momento histórico en
el que nos encontramos, en el cual disponemos de tecnologías que nos permiten una mayor
disponibilidad y acceso a datos científicos a nivel mundial, aumentando la colaboración e
MBIGDA_M4T1_160901
26
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
incrementando el ritmo y la profundidad del descubrimiento, aquí es donde surge el término “Open
Data”, cuya filosofía fundamental es permitir que los datos estén disponibles para que todo el
mundo tenga acceso a ellos.
En la web semántica, la información está representada de modo formal donde por lo general no
hay ambigüedades.
Programas, usando ontologías con las cuales se describen semánticamente las páginas
HTML.
En síntesis, la web semántica está basado en dos conceptos que son fundamentales:
MBIGDA_M4T1_160901
27
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
La descripción del significado que tiene los contenidos en la web, lo que se requiere conocer
algunos conceptos:
Semántica = entendida como significado procesable por máquinas.
Metadatos = son contenedores de información semántica sobre los datos.
2) Ontologías = conjunto de términos y relaciones entre ellos que describe un dominio
de la aplicación concreta.
MBIGDA_M4T1_160901
28
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Metadatos
En el sentido genérico, se define Metadato, como datos acerca de los datos. En el contexto
de este trabajo, se define como información estructurada (objeto de información) que es
procesable automáticamente, que puede ser usada para dar soporte a distintas operaciones.
MBIGDA_M4T1_160901
29
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Cada sistema tiene características particulares y permite expresar diferentes grados de semántica.
El esquema de metadatos más adecuado para este trabajo por su expresividad y capacidad de
realizar inferencias, es la ontología.
1.1.1. Ontologías
1.1.2. Componentes
Los conceptos son representados por medio de clases, a su vez cada objeto tiene propiedades que
están compuestas por atributos y relaciones.
MBIGDA_M4T1_160901
30
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Así mismo las clases tienen métodos o funciones que se utilizan para realizar algún cálculo o
relación con los datos.
1.1.3. Axiomas
Los Axiomas, o reglas de restricción, son teoremas que se declaran sobre relaciones que
deben cumplir los elementos de la ontología. Modelan sentencias lógicas que se verifican siempre.
Se utilizan habitualmente para modelar conocimiento que no puede ser representado utilizando los
otros componentes.
Restricciones: indican propiedades que el modelo debe cumplir. Sirven para detectar
inconsistencias.
Los axiomas, junto con la herencia de conceptos, permiten inferir conocimiento que no está
indicado explícitamente en la taxonomía de conceptos.
La decisión de utilizar o no reglas, debe tomarse cuidadosamente, ya que las reglas proporcionan
una gran capacidad expresiva pero también una mayor complejidad al razonar con la ontología, lo
que en la actualidad, puede ocasionar problemas de escalabilidad.
MBIGDA_M4T1_160901
31
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MBIGDA_M4T1_160901
32
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MBIGDA_M4T1_160901
33
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MBIGDA_M4T1_160901
34
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MBIGDA_M4T1_160901
35
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MBIGDA_M4T1_160901
36
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Con la búsqueda sintáctica se pueden producir tres situaciones que podrían llevar a errores:
Un motor de búsqueda semántica puede verse como una herramienta que recibe
consultas basadas en ontologías, las ejecuta contra una base de conocimiento y
devuelve los documentos que satisfacen la consulta. Los conceptos e instancias de la
KB se asocian a los documentos mediante las anotaciones.
Las mejoras con respecto a la búsqueda por palabra clave crecen con el
número de condiciones.
MBIGDA_M4T1_160901
37
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
CycL
El primer lenguaje en ser creado fue CycL. Está basado en marcas y lógica de primer orden, y
fue utilizado para construir la ontología de propósito general CYC. El lenguaje consta de un
vocabulario de aproximadamente 160 términos.
El conjunto de términos puede ser clasificado en constantes, términos no tónicos, variables
y otro tipo de objetos. Los términos se combinan en expresiones, las cuales son utilizadas para
hacer aseveraciones en la base de conocimiento CYC.
KIF
Está basado en lógica de primer orden y marcas. Es de bajo nivel pero de mayor poder
expresivo que algunos de sus sucesores, como OKBC y Ontolingua.
KIF provee definiciones para objetos, funciones, relaciones y constantes lógicas. Es un lenguaje para
intercambio de conocimiento, fue diseñado para permitir traducciones entre lenguajes de
representación más especializados. Por esta razón es tedioso utilizar esta herramienta para el
desarrollo de ontologías.
MBIGDA_M4T1_160901
38
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
LOOM
Ontolingua
Es un lenguaje que permite construir, publicar y compartir ontologías, con una clara semántica
basada en KIF. Las ontologías pueden traducirse automáticamente a distintos lenguajes, como KIF,
LOOM, Prolog, y CLIPS. Tiene el inconveniente que provee un gran poder expresivo sin ningún
medio para controlarlo. Todos estos lenguajes guardan relación con OKBC (Protocolo para la
conectividad de Bases de Conocimiento Abierto). Este protocolo permite acceder bases de
conocimiento almacenadas en diferentes sistemas de representación y que pueden estar basadas
en diferentes paradigmas de representación de conocimiento.
OCML
MBIGDA_M4T1_160901
39
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
SHOE
XML
MBIGDA_M4T1_160901
40
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
RDF / RDFs
Por otro lado, existen los RDFs que poseen un vocabulario propio que facilita la representación
de clases y relaciones entre ellos.
MBIGDA_M4T1_160901
41
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
OIL
Ontology Inference Layer (OIL), sintetiza el trabajo de tres comunidades diferentes para
proveer un lenguaje de propósito general basado en etiquetas. Usa sistemas basados en frames,
lógica descriptiva y estándares Web (XML y RDF)
Por parte de los lenguajes basados en frames, tiene como primitivas centrales de modelación,
clases con propiedades. De la lógica descriptiva, hereda la semántica formal y el soporte eficiente
para razonamiento. Además, tiene una sintaxis bien definida en XML y es una extensión de RDF y
RDFS.
DAML
Hereda muchos aspectos de OIL y las capacidades de ambos lenguajes son relativamente
similares. Al igual que OIL las características principales son:
Soportar jerarquía de clases y propiedades
Permitir la construcción de clases a partir de otras usando combinaciones de
intersección, unión, y complemento
Permitir restricciones de dominio, rango y cardinalidad
Soportar propiedades transitivas e inversas
OWL
OWL (Ontology Web Lenguaje), es una extensión de la semántica de RFDs para describir las
clases y sus propiedades. El lenguaje sigue el paradigma de la lógica descriptiva con lo cual es
posible razonar el conocimiento para descubrir otros nuevos que no están explícitamente
representado en la ontología.
Características:
Permite expresar características de la relaciones.
Permite expresar restricciones de las propiedades.
Introduce nuevos constructores en las clases.
Permite expresar restricciones entre clases.
MBIGDA_M4T1_160901
42
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Dicho lenguaje tiene algunas bondades que lo hacen muy atractivo a la hora de analizar la web.
Clasifica las clases dentro de una jerarquía.
Clasifica las instancias de una clase determinada y en que jerarquía se encuentra.
Detecta redundancia en la clasificación de instancias.
Resolución de consultas semánticas SPARQL.
Chequea la consistencia en la comprobación de las jerarquías de las clases.
Por otra parte, cada vez que el analizador semántico se ejecuta, debe ser almacenada en
alguna base de datos para un posterior análisis más exhaustivo de la información. Para ello, vamos
a utilizar bases de datos cuyos esquemas están definido a través de ontologías representadas en
RDFs ( Base de datos semánticas), esto significa que tendremos que utilizar algún lenguaje de
consulta para acceder a la información ya analizada, es decir, a los datos de la ontología. En síntesis
ese tipo de bases de datos, utiliza un lenguaje de consulta denominado SPARQL.
SPARQL
MBIGDA_M4T1_160901
43
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
De grupo ({})
Alternativos (UNION)
Opcionales (OPTIONAL)
MBIGDA_M4T1_160901
44
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
SPARQL, además permite realizar consultas externas a la base, directamente sobre la web a
través de servicios.
Anotadores semánticos
MBIGDA_M4T1_160901
45
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Sistemas Manuales
- Annotea
MBIGDA_M4T1_160901
46
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
- Annozilla
Está diseñado para ver y crear anotaciones asociadas a una página Web, siguiendo los
lineamientos del proyecto Annotea. Este anotador opera almacenando anotaciones en formato RDF
en un servidor, utilizando XPointer para identificar la región del documento a anotar.
Annozilla deriva su nombre el navegador Mozilla, del cual utiliza sus características nativas para
manipular la meta data, en particular el manejo de RDF para efectuar el parsing.
- OntoMat-Annotizer
Fue desarrollado para que los usuarios finales pudieran enriquecer sus páginas con meta data;
en vez de anotar las páginas Web con un editor de texto común, OntoMat permite resaltar las
porciones de texto deseadas a través de interacciones de tipo drag and drop.
- SemanticWord
MBIGDA_M4T1_160901
47
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
- SMORE
- YAWAS
Es una herramienta que permite realizar anotaciones y personalizar los documentos a medida
que analiza la información en páginas Web. Es una herramienta de código abierto, muy simple y
liviano, que permite resaltar las porciones de texto deseadas. Codifica las anotaciones en URLs
extendidas y utiliza archivos locales para almacenar, recuperar y compartir con otros usuarios las
anotaciones. Además proporciona el buscador Yawas Quick Search, que permite buscar en los
documentos los términos previamente anotados.
Los agentes Web pueden ser diseñados para tratar la información existente en las páginas Web
de manera semiautomática. Se trata de convertir la información en conocimiento, referenciando
datos dentro de las páginas Web a metadatos con un esquema común consensuado sobre algún
dominio. Estos sistemas explotan técnicas de Procesamiento de Lenguaje Natural (PLN) para
extraer las referencias en el texto a ciertos conceptos descritos en ontologías. Estos sistemas
requieren generalmente como entrada patrones o corpus de documentos utilizados para entrenar
el sistema. A continuación se comentan algunos de los anotadores semiautomáticos existentes.
MBIGDA_M4T1_160901
48
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
MELITA
MnM
Es una herramienta de anotación que provee soporte automático y semiautomático para anotar
páginas Web con contenido semántico.
Integra un navegador Web, un editor de ontologías, medios para efectuar enlaces con servidores de
ontologías y vínculos con herramientas de extracción de información.
Permite cargar ontologías preexistentes, crear o cargar bases de conocimiento y poblar las mismas
de forma manual o semiautomática mediante entrenamiento con un corpus de prueba. No provee
soporte para OWL, solamente para DAML+OIL, WebOnto y RDF.
OntoGloss
MBIGDA_M4T1_160901
49
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Mantiene las anotaciones separadas del documento, en una base de datos, las cuales son
cargadas en cada visita al documento. Permite exportar las anotaciones en formato RDF, el cual
puede ser manipulado, además tiene capacidades de consulta. Soporta servidores de anotación
locales y remotos.
Sistemas Automáticos
Los sistemas de anotación automáticos son herramientas que aplican técnicas de extracción de
información de lenguaje natural para generar automáticamente anotaciones en páginas Web.
A los efectos de este trabajo, son muy necesarios, pues contribuyen en gran medida a hacer
manejable la anotación masiva de documentos. En la actualidad no es posible encontrar disponible
en Internet tanta cantidad de ellos como de anotadores manuales y semiautomáticos, lo que
restringe el número de opciones. En las siguientes secciones se describen los anotadores
automáticos encontrados.
AeroDAML
MBIGDA_M4T1_160901
50
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
KIM
Magpie
MBIGDA_M4T1_160901
51
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
En otros casos, puede ser necesario convertir una ontología de un lenguaje a otro, o entre
distintos formatos de un mismo lenguaje. Contar con herramientas que automaticen el proceso
disminuye la posibilidad de cometer errores y contribuye a enfocar la energía en las tareas que no
pueden ser realizadas automáticamente.
Varias herramientas han aparecido en la última década. A continuación se comentan
Ontolingua, WebODE, Protege, OilEd y Jena.
Ontolingua
Proporciona una sintaxis basada en marcos y traduce toda la información en KIF, que es una
forma de codificación de la información en Lógica de Primer Orden.
No existe restricción de expresividad. Ontolingua provee un ambiente distribuido de
colaboración para buscar, crear, editar, modificar y utilizar ontologías.
WebODE
WebODE se ha desarrollado como un marco escalable para dar soporte a las siguientes actividades:
MBIGDA_M4T1_160901
52
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
OilEd
Protégé
Provee un ambiente integrado para la mayoría de las actividades del ciclo de vida de las
ontologías. Es una plataforma gratuita que ofrece un conjunto de herramientas para construir
modelos de dominio y ontologías. Puede ser tenida en cuenta para construir nuevas herramientas
y aplicaciones. Protege implementa varias estructuras y acciones para modelado del conocimiento
que soportan la creación, visualización y manipulación de ontologías en varios formatos de
representación.
Apache Jena
MBIGDA_M4T1_160901
53
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Razonadores
Las ontologías pueden tornarse muy complejas, y por tanto es más fácil cometer errores lógicos
que la transformen en inconsistente. Los razonadores son herramientas útiles que permiten
verificar consistencia, factibilidad de los conceptos y determinar la clase más específica de un
individuo, entre otros. En los siguientes puntos se enumeran y describen brevemente los
razonadores más utilizados.
Racer
RACER (Renamed ABox and Concept Expression Reasoner), es un razonador para Lógica
Descriptiva que da soporte a OWL Lite y OWL DL. Las características más relevantes son:
Verificación de relaciones de factibilidad y jerarquía entre conceptos.
Verificación de consistencia.
Recuperación de instancias a partir de conceptos especificados o de consultas.
Asimismo recupera tuplas de individuos que satisfagan un conjunto de condiciones.
Determinación del concepto más específico al que pertenece un individuo dado.
Pellet
FaCT++
MBIGDA_M4T1_160901
54
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
KAON2
DOM
MBIGDA_M4T1_160901
55
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Como una especificación de W3C, un objetivo importante para DOM es proporcionar una API que
pueda ser utilizada en una amplia variedad de entornos y aplicaciones y en cualquier lenguaje de
programación.
SAX
(Simple API for XML) es una especificación ampliamente utilizada, que describe como los
parsecs XML pueden pasar información eficientemente de los documentos XML a las aplicaciones.
SAX fue implementado originalmente en Java, pero actualmente es soportado por la mayoría de los
lenguajes de programación. SAX es una interfaz de streaming, las aplicaciones reciben información
de documentos XML en un flujo continuo, sobre el cual no pueden efectuar ningún tipo de
navegación. Este enfoque hace a SAX extremadamente eficiente, manejando documentos XML de
casi cualquier extensión en tiempo razonable, pero también demanda mayor esfuerzo de
programación. Las interfaces con enfoque basado en árboles, como DOM, emplean el enfoque
opuesto: menor esfuerzo de desarrollo a costa de mayores recursos computacionales.
jAXP
JAXP (Java API for XML Processing), es una API para procesar datos XML en aplicaciones
escritas en Java. Permite efectuar de manera sencilla la validación, parsing, y transformación de
documentos XML a través de diferentes funciones.
Soporta los estándares SAX y DOM, y es independiente de las implementaciones de los
procesadores XML, permitiendo hacer parsing como un flujo de eventos o construyendo la
representación de objetos de ellos.
JDOM
Es una representación Java de un documento XML. Provee una manera de representar los
documentos facilitando su lectura, manipulación y escritura. Tiene una API liviana y directa,
optimizada para la programación en Java. Es una alternativa para DOM y SAX, aunque se integra
bien con ambos.
MBIGDA_M4T1_160901
56
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Se puede construir documentos JDOM a partir de archivos XML, arboles DOM, eventos SAX o
cualquier otra fuente.
Dom4j
Es un framework XML de código abierto para Java. Permite leer, escribir, navegar, crear y
modificar documentos XML y está integrado con DOM, SAX y JAXP.
dom4j es una API más simple y liviana que DOM, y hace uso extensivo de APIs estándar de Java
tales como las colecciones de Java 2. dom4j soporta completamente el estándar DOM y utiliza JAXP
para configurar el parser SAX usar.
Es posible crear documentos dom4j a partir de texto XML, eventos SAX o arboles DOM existentes, y
escribir documentos dom4j en los mismos formatos.
dom4j y JDOM son proyectos y APIs diferentes, aunque con objetivos similares.
Ambos intentan facilitar la tarea de utilizar XML sobre una plataforma Java. Difieren en su diseño,
API e implementación. dom4j está basado en interfaces Java y hace uso extensivo del
polimorfismo. JDOM y dom4j pueden usar JAXP internamente para hacer el parsing SAX.
MBIGDA_M4T1_160901
57
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Conclusiones
Los temas tratados en esta primera etapa, son considerados de introducción a la web de los
datos, en especial la web semántica, donde se abordaron conceptos teóricos que son la base para
el entendimiento de los próximos temas del curso.
Así mismo, considero que la temática es extremadamente amplia y compleja, con muchos
matices y avances tecnológicos, con lo cual, se hace imposible abordar por completo todo lo que
existe, es por ello que se realizó un compilado de lo que considero, es lo más importe y que servirá
de base de conocimiento, para que el alumno profundice más sobre el tema.
MBIGDA_M4T1_160901
58
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Bibliografía
Adaptative Network Solutions. (2014). Adaptative Network Solutions Technology. Retrieved
from http://www.an-solutions.de/wsn_technology.html
ANT+. (2014). ANT / ANT+ Defined. Retrieved from
http://www.thisisant.com/developer/ant-plus/ant-antplus-defined/
Athow, D. (2014, 6 20). TechRadar.pro : How Bluetooth Smart is shaping the internet of
things. Retrieved from http://www.techradar.com/news/world-of-tech/futuretech/ how-
bluetooth-smart-is-shaping-the-internet-of-things- 1253196/1#articleContent Awesense Inc.
(n.d.). True Grid IntelligenceTM (TGI). Retrieved from
http://www.awesense.com/solutions.html#tgi Bigbelly Inc. (n.d.).
BigBelly Change your Space. Retrieved from
http://bigbelly.com/solutions/stations/smartbelly/
Bradley, J. (2013). Cisco: Embracing the Internet of Everything. Retrieved from
http://www.bgs.ac.uk/research/tomography/alarms.html
Contiki. (2014). Get Started With Contiki. Retrieved from
http://www.contikios.org/start.html.Retrieved from http://www.dash7-
alliance.org/?page_id=18
enGauge Inc. (2014). Fire Extinguisher Monitoring Makes Sense. Retrieved from
http://www.engaugeinc.net/fire-extinguisher-monitoring
EnOcean. (2014). EnOcean Green Smart Wireless, Technology. Retrieved from
https://www.enocean.com/en/technology/
Ericsson. (2010, 4 13). CEO to shareholders: 50 billion connections 2020. Retrieved from
http://www.ericsson.com/thecompany/press/releases/2010/04/1403231
Groendeldt, T. (2012, 8 3). E-Commerce Style Big Data Analytics Meet Brick And Mortar.
Retailers. Retrieved from Revista Forbes:
http://www.forbes.com/sites/tomgroenfeldt/2012/08/03/e-commerce-style-bigdata-
analytics-meet-brick-and-mortar-retailers/ Retrieved from http://www.internet-of-
thingsresearch.eu/pdf/IoT_Cluster_Strategic_Research_Agenda_2011.pdf
MBIGDA_M4T1_160901
59
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Isam Ishaq, D. C. (2013). ETF Standardization in the Field of the Internet of Things (IoT): A
Survey. Journal of Sensor and Actuator Networks, 236-287.
Jaffey, T. (2014, 2). Eclipse. Retrieved from MQTT and CoAP, IoT Protocols:
http://eclipse.org/community/eclipse_newsletter/2014/february/article2.php
Libelium Corporation. (2014). Smart Water Sensors to monitor water quality in rivers, lakes
and the sea. Retrieved from http://www.libelium.com/smart-watersensors-monitor-water-
quality-leakages-wastes-in-rivers-lakessea#!
Libelium Waspmote. (n.d.). Waspmote Features. Retrieved from
http://www.libelium.com/products/waspmote
Mimo. (n.d.). Mimo: Stay connected with the Mimo Baby Monitor. Retrieved from
http://mimobaby.com/#MeetMimo
Nash, J. B. (1934). The Internet of Things is coming – Jay B. Nash. Retrieved from FLYCZ
Nest Inc. (2014). Nest Learning Thermostat. Retrieved from https://nest.com/
NinjaBlocks. (2014). Ninja Blocks Monitor and control your things anywhere. Retrieved from
http://shop.ninjablocks.com/collections/ninja-blocks/products/ninja-blockskit Olivier
Hersent, D. B. (2011). The Internet of Things: Key Applications and Protocols.
John Wiley & Sons. OpenWSN . (2014). OpenWSN Home. Retrieved
fromhttps://openwsn.atlassian.net/wiki/display/OW/Hardware
Paulantonio, J. A. (2012, 07 22). The Internet of things can Change. Retrieved from
http://press.teleinteractive.net/tialife/2012/07/22/the-internet-of-things-andchange
Phidgets. (2014). Phidgets products for USB sensing and Control. Retrieved from
http://www.phidgets.com/products.php?category=1
Postscapes. (2013). PostScapes Tracking the Internet of Things. Retrieved from
http://postscapes.com/internet-of-things-history
Press, G. (2010, 6 18). A Very Short History Of The Internet Of Things. Retrieved from Forbes
magazine: http://www.forbes.com/sites/gilpress/2014/06/18/a-veryshort- history-of-the-
internet-of-things/
MBIGDA_M4T1_160901
60
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
Proteus Digital Health. (n.d.). Proteus Digital Health Announces FDA Clearance of Ingestible
Sensor. Retrieved from http://proteusdigitalhealth.com/proteus-digitalhealth- announces-
fda-clearance-of-ingestible-sensor/
Riot. (2014). RiOT Features. Retrieved from http://riot-os.org/#features
Rohde&Schwarz. (2012, 6). UMTS Long Term Evolution (LTE) – Technology Introduction.
Retrieved from
http://cdn.rohdeschwarz.com/pws/dl_downloads/dl_application/application_notes/1ma11
1/1MA111_4E_LTE_technology_introduction.pdf
Sargent, N. (n.d.). Bumblebee nesting project. Retrieved from
http://niksargent.com/bumblebee/ Serbulent Tozlu, M. S. (2012, 6). IEEE Communications.
Retrieved from Wi-Fi Enabled
Sensors for Internet of Things: A Practical Approach:
http://web.univpau.fr/~cpham/ENSEIGNEMENT/PAU-
UPPA/RHD/PAPER/OLD/WifiSensor.pdf
Smart Structures Inc. (2014). Smart Structures EDC - Embedded Data Collector. Retrieved
from http://smart-structures-inc.us/technology/EDC-embedded-datacollector/
Streetline Inc. (2014). Introducing ParkSight™ 2.0 Parking Analytics. Retrieved from Thubert,
P. (2013). Industrial Ethernet Book. Retrieved from
http://www.iebmedia.com/index.php?id=10339&parentid=63&themeid=255&hft83&show
detail=true&bb=1
WeigthLess TM. (2014). SPECTRUM FOR WEIGHTLESS. Retrieved from
http://www.weightless.org/about/spectrum-for-weightless
WiMAX Forum. (2012). WiMAX Forum Withe papers. Retrieved
fromhttp://resources.wimaxforum.org/resources/documents/marketing/whitepapers
ZigBee Alliance. (2012). ZigBee Specifications. Retrieved from
http://www.zigbee.org/Specifications.aspx
Z-Wave. (n.d.). About Z-Wave, What is Z-Wave home control? Retrieved from
Ubiquitous Networks: The New IT Paradigm Teruyasu Murakami (Nomura Research
Institute)
MBIGDA_M4T1_160901
61
Tema 1. Tecnologías, protocolos y
lenguajes en internet.
NRI Papers nº 30 August 2001. Protocol for carrying Authentication for Network Access
(pana), http://www.ietf.org/html.charters/pana-charter.html
Simple Authentication and security Layer (sasl), http://www.ietf.org/html.charters/sasl-
charter.html
Security for Ubiquitous Computing, Frank Stajano; Jhon Wiley & Sons; 1St edition 2002
SAML – Security Assertion Markup Language, http://www.oasis-open.org/committes/security
F. Bennett et al, “Embedded Mobile Networking”. IEEE Pers. Common. Vol 4, nº 5, Oct 1997
R. Want et al. “The ParcTab Ubiquitous Computing Experiment”, Mobile Computing 1995
Guia Breve de Web Semantica,
http://www.w3c.es/Divulgacion/Guiasbreves/WebSemantica
Ultimo Acceso: 11/07/2006, Tutorial: Semantic Web,
http://www.w3schools.com/semweb/default.asp
MBIGDA_M4T1_160901
62