Está en la página 1de 20

Unidad 8

Unidad 8

SERVICIOS DE AUDIO Y VÍDEO

1 de 20
Unidad 8

Objetivos

Objetivos

Cuando finalices este tema habrás a aprendido a...

Administrar servicios de audio identificando las necesidades de distribución y adaptando los


formatos.
Administrar servicios de vídeo identificando las necesidades de distribución y adaptando los
formatos.

2 de 20
Unidad 8

Conocimiento Previo

Conocimiento previo

Necesitas tener los siguientes conocimientos:

Conocimientos básicos de redes.


Estar familiarizado con el interfaz terminal en Gnu/Linux.

3 de 20
Unidad 8

Motivación

En la actualidad el uso de los servicios de audio y vídeo en la Web está muy extendido.

Las televisiones y radios online ofrecen gran cantidad de contenidos en sus webs. Cualquier medio que se precie
tiene a disposición de los usuarios, desde la emisión en directo de sus canales hasta la posibilidad de descarga
y/o visualización online de todos sus programas grabados.

Existen multitud de webs especializadas que ofrecen grandes repositorios de recursos multimedia, generalmente
vídeos (documentales, peliculas, etc) y audios (música). Sin ir más lejos la archiconocida YouTube entre otras
muchas opciones.

Todos estos servicios utilizan lo que se conoce como streaming para realizar su emisión online.

Por otro lado, la telefonía siempre ha supuesto un coste bastante importante en cualquier organización. La
posibilidad de aprovechar la infraestructura de red para hacer llamadas de voz a coste cero ha supuesto una
solución para muchas de ellas. Estamos hablando de la tecnología voIP.

Finalmente, la posibilidad de hacer reuniones o entrevistas entre personas que se encuentran muy distantes
geográficamente y sin necesidad de que los miembros se desplacen físicamente puede ahorrar grandes costes a
la vez de ganar en comodidad y eficacia. La tecnología de videoconferencia nos trae esta posibilidad.

A lo largo de este tema vamos a tratar todos estos tecnologías.

4 de 20
Unidad 8

Audio. Conceptos y formatos.

Conceptos

Frecuencia.
Es el número de vibraciones por segundo que da origen al sonido analógico. El espectro de un sonido se
caracteriza por su rango de frecuencias. Ésta se mide en Hertzios (Hz). El oído humano capta sólo aquellos
sonidos comprendidos en el rango de frecuencias 20 Hz y 20.000 Hz.

Tasa de muestreo (sample rate).


Un audio digital es una secuencia de ceros y unos que se obtiene del muestreo de la señal analógica. La tasa de
muestreo o sample rate define cada cuánto tiempo se tomará el valor de la señal analógica para generar el audio
digital. Esta tasa se mide en Hertzios (Hz). Por ejemplo: 44100 Hz. nos indica que en un segundo se tomaron
44100 muestras de la señal analógica de audio para crear el audio digital correspondiente. Un audio tendrá más
calidad cuanto mayor sea su tasa de muestreo. Algunas frecuencias estándares son 44100 Hz., 22050 Hz., y
11025 Hz.

Resolución (bit resolution)


Es el número de bits utilizados para almacenar cada muestra de la señal analógica. Una resolución de 8-bits
proporciona 256 (28) niveles de amplitud, mientras que una resolución de 16-bits alcanza 65536 (216 ). Un audio
digital tendrá más calidad cuanto mayor sea su resolución. Ejemplo: El audio de calidad CD suele ser un sonido
de 44.100 Hz – 16 bits – estereo.

Velocidad de transmisión (bitrate)


El bitrate define la cantidad de espacio físico (en bits) que ocupa un segundo de duración de ese audio. Por
ejemplo, 3 minutos de audio MP3 a 128kBit/sg, ocupa 2,81 Mb de espacio físico (3min x 60 seg/min x 128 kBit/seg
= 23040 kBits -> 23040 kBits x 1024 bits/Kbit : 8 bits/bytes : 1024 bytes/Kbytes : 1024 Kbytes/Mbytes = 2,81
MBytes ó Mb). Por ejemplo en los audios en formato MP3 se suele trabajar con bitrates de 128 kbps (kilobits por
segundo). El audio tendrá más calidad cuanto mayor sea su bitrate y el archivo que lo contiene tendrá mayor
peso. Esta magnitud se utiliza sobre todo en el formato MP3 de audio más destinado a la descarga por Internet.

CBR/VBR
Constant/Variable Bitrate. CBR indica que el audio ha sido codificado manteniendo el bitrate constante a lo largo
del clip de audio mientras que VBR varía entre un rango máximo y mínimo en función de la tasa de transferencia.

Códec.
Acrónimo de "codificación/decodificación". Un códec es un algoritmo especial que reduce el número de bytes que
ocupa un archivo de audio. Los archivos codificados con un codec específico requieren el mismo códec para ser
decodificados y reproducidos. El códec más utilizado en audio es el MP3.

Decibelio.
Unidad de medida del volumen o intensidad de un sonido. El silencio o ausencia de sonido se cuantifica como 0
dB y el umbral del dolor para el oído humano se sitúa en torno a los 130-140 dB.

Formatos de audio

Las audios digitales se pueden guardar en distintos formatos. Cada uno se corresponde con una extensión
específica del archivo que lo contiene. Existen muchos tipos de formatos de audio y no todos se pueden escuchar
utilizando un mismo reproductor: Windows Media Player, QuickTime, WinAmp, Real Player, etc.

Aquí trataremos los formatos más utilizados y universales: WAV, MP3 y OGG.

5 de 20
Unidad 8

Formato WAV

El formato WAV (WaveForm Audio File) es un archivo que desarrolló originalmente Microsoft para guardar
audio. Los archivos tienen extensión *.wav
Es ideal para guardar audios originales a partir de los cuales se puede comprimir y guardar en distintos
tamaños de muestreo para publicar en la web.
Es un formato de excelente calidad de audio.
Sin embargo produce archivos de un peso enorme. Una canción extraída de un CD (16 bytes, 44100 Hz y
estéreo) puede ocupar entre 20 y 30 Mb.
Compresión: Los archivos WAV se pueden guardar con distintos tipos de compresión. Las más utilizadas
son la compresión PCM y la compresión ADPCM. No obstante incluso definiendo un sistema de
compresión, con un audio de cierta duración se genera un archivo excesivamente pesado.
El formato WAV se suele utilizar para fragmentos muy cortos (no superiores a 3-4 segundos), normalmente
en calidad mono y con una compresión Microsoft ADPCM 4 bits.

Formato MP3

El formato MP3 (MPEG 1 Layer 3) fue creado por el Instituto Fraunhofer y por su extraordinario grado de
compresión y alta calidad está prácticamente monopolizando el mundo del audio digital.
Es ideal para publicar audios en la web. Se puede escuchar desde la mayoría de reproductores.
La transformación de WAV a MP3 o la publicación directa de una grabación en formato MP3 es un proceso
fácil y al alcance de los principales editores de audio.
Tiene un enorme nivel de compresión respecto al WAV. En igualdad del resto de condiciones reduciría el
tamaño del archivo de un fragmento musical con un factor entre 1/10 y 1/12.
Presentan una mínima pérdida de calidad.

Formato OGG

El formato OGG ha sido desarrollado por la Fundación Xiph.org.


Es el formato más reciente y surgió como alternativa libre y de código abierto (a diferencia del formato
MP3).
Muestra un grado de compresión similar al MP3 pero según los expertos en música la calidad de
reproducción es ligeramente superior.
No todos los reproductores multimedia son capaces de leer por defecto este formato.
En algunos casos es necesario instalar los códecs o filtros oportunos.
El formato OGG puede contener audio y vídeo.

6 de 20
Unidad 8

Vídeo. Conceptos y formatos.

Conceptos

Dimensiones.
Es el tamaño del vídeo (ancho x alto) expresado en píxeles cuando se visualiza al 100%, sin agrandar ni reducir.
Los reproductores pueden mostrar un vídeo a pantalla completa o con
una ampliación del 200%, 300%, etc. En estos casos el vídeo pierde calidad de imagen y esta pérdida depende
del formato de archivo. Un vídeo AVI puede tener cualquier ancho y alto
mientras que los estándares de vídeoCD son 352 x 288 y de DVD 720 x 576.

Codec.
Acrónimo de "codificación/decodificación". Un códec es un algoritmo especial que reduce el número de bytes que
ocupa un archivo de vídeo. Los archivos codificados con un códec
específico requieren el mismo códec para ser decodificados y reproducidos. Algunos de los códecs más utilizados
para el formato AVI son: DivX, XviD, CinePak, Intel Indeo 5, DV, etc.

Velocidad de transmisión (bitrate) El bitrate define la cantidad de espacio físico (en bits) que ocupa un segundo
de duración de ese vídeo. El vídeo tendrá más calidad cuanto mayor sea su bitrate y el archivo que lo contiene
tendrá mayor peso. El bitrate puede ser fijo o variable. El bitrate variable consigue mayor calidad de imagen
porque recoge más calidad en escenas muy cargadas o con mucho movimiento y ahorra en aquellas más
estáticas.

Fotogramas por segundo.


Un vídeo resulta de la exposición imágenes o fotogramas uno detrás de otro. Un parámetro de la calidad del vídeo
es el número de fotogramas por segundo que muestra durante su
reproducción. Este valor oscila entre 15 y 30. Por ejemplo los vídeos en DVD en Europa exhiben 25 fotogramas
por segundo (25 fps).

Fotogramas Clave.
Cuando se aplica un códec de compresión a un vídeo, se suele producir cierta pérdida de la información de sus
fotogramas. Algunos fotogramas (los fotogramas clave) se almacenan
completamente en el archivo comprimido, mientras que el resto sólo se guardan parcialmente.
En la descompresión, estos fotogramas intermedios se reconstruyen a partir de los fotogramas clave.

Sistemas de televisión.

NTSC (National Television Standards Comité = Comité Nacional de Estándares de Televisión). Cada
fotograma está formado por 525 líneas y reproduce 30 fotogramas por segundo. Se utiliza en América del
Norte, Centroamérica, Japón, etc.
PAL (Phase Alternation Line = Línea Alternada en Fase): El vídeo PAL tiene 625 líneas por fotograma y 25
fotogramas por segundo. Es el sistema más extendido actualmenteen Europa.
SECAM (Séquentiel Couleur à Mémoire = Color secuencial con memoria). Muestra 625 líneas y 25
fotogramas por segundo. De origen francés, ha perdido mercado en Europa a favor del sistema PAL.

Proporción o ratio de aspecto.


Es la proporción entre la anchura y altura de un vídeo. Cuando se reproduce un vídeo se suele mantener por
defecto esta proporción para evitar deformación de las imágenes. Por este
motivo cuando se elige la visualización a pantalla completa, aparecen franjas negras arriba y abajo. Es habitual
una relación 4:3 para los vídeos domésticos (352x288 píxeles, por ejemplo) mientras que en DVD se suele
trabajar con ratios de 16:9.

7 de 20
Unidad 8

Formatos de vídeo

Los vídeos digitales se pueden guardar en archivos de distintos formatos. Cada uno se corresponde con una
extensión específica del archivo que lo contiene. Existen muchos tipos
de formatos de vídeo. Aquí se citan algunos de los más utilizados. Asimismo cada tipo de archivo admite en cada
momento un códec de compresión distinto.

AVI (Audio vídeo Interleaved = Audio y vídeo Intercalado)

Es el formato estándar para almacenar vídeo digital.


Cuando se captura vídeo desde una cámara digital al ordenador, se suele almacenar en este formato con
el códec DV (Digital vídeo).
El archivo AVI puede contener vídeo con una calidad excelente. Sin embargo el peso del archivo resulta
siempre muy elevado.
Admite distintos códecs de compresión como CinePak, Intel Indeo 5, DV, etc. Los códecs con más
capacidad de compresión y una calidad aceptable son DivX y XviD.
El formato AVI puede ser visualizado con la mayoría de reproductores: Windows Media, QuickTime, etc.
siempre y cuando se encuentren instalados en el equipo los adecuados códecs para cada tipo de
reproductor.
Es ideal para guardar vídeos originales que han sido capturados de la cámara digital (codificados con DV).
No es recomendable publicarlos en Internet en este formato por su enorme peso.
Los códecs CinePak, Intel Indeo, DV, etc. no ofrecen una gran compresión. Los códecs DivX y XviD por el
contrario consiguen una óptima compresión aunque se suelen destinar sobre todo a la codificación de
películas de larga duración.

MPEG (Moving Pictures Expert Group = Grupo de Expertos de Películas)

Es un formato estándar para la compresión de vídeo digital.


Son archivos de extensión *.MPG ó *.MPEG.
Admite distintos tipos de códecs de compresión: MPEG-1 (calidad CD), MPEG-2 (calidad DVD), MPEG-3
(orientado al audio MP3) y MPEG-4 (más orientado a la web).
Se reproducen con Windows Media Player y QuickTime.

MOV (http://www.apple.com/es/quicktime/)

Es el formato de vídeo y audio clásico desarrollado por Apple.


Utiliza un códec propio que evoluciona en versiones con bastante rapidez.
Este tipo de archivos también pueden tener extensión *.QT
Se recomienda utilizar el reproductor de QuickTime. Existe una versión gratuita del mismo que se puede
descargar de Internet.
Es ideal para publicar vídeos en Internet por su razonable calidad/peso.
Admite streaming.

WMV (http://www.microsoft.com/windows/windowsmedia/es/)

Ha sido desarrollado por Microsoft.


Utiliza el códec MPEG-4 para la compresión de vídeo.
También puede tener extensión *.ASF
Sólo se puede visualizar con una versión actualizada de Windows Media 7 o superior.
Esta aplicación viene integrada dentro de Windows.
Es ideal para publicar vídeos en Internet por razonable calidad/peso.
Admite streaming.

RM (http://spain.real.com/realplayer)

8 de 20
Unidad 8

Es la propuesta de Real Networks para archivos de vídeo.


Utiliza un códec propio para comprimir el audio.
Este tipo de archivos tiene extensión *.RM y *.RAM.
Se visualiza con un reproductor específico: Real Player. Existe una versión gratuita del mismo que se
puede descargar de Internet.
Se puede utilizar para publicar vídeos en Internet por su aceptable calidad/peso.
Admite streaming.

MP4 (http://www.apple.com/quicktime/technologies/mpeg4/)

Es un nuevo formato de vídeo desarrollado por Apple.


Se basa en el estándar MPEG-4 utilizando el códec H.264 AVC para vídeo y el códec AAC o MP3 para
audio.
Son archivos de extensión *.MP4.
Es un formato de vídeo de gran popularidad y expansión debido a que se utiliza en los reproductores
personales iPod y en el software de reproducción QuickTime+iTunes de Apple.
En el ordenador se puede reproducir con VLC Media Player, QuickTime, etc.
El repositorio de vídeos Youtube o Vimeo utiliza el formato MP4 para la descarga de los vídeos en alta
calidad HQ.
El archivo *.MP4 es un contenedor dentro del cual además de audio y vídeo sincronizados también se
pueden almacenar imágenes fijas, subtítulos, información de capítulos, etc.
Admite streaming.

FLV (http://www.adobe.com)

Es un formato que utiliza el reproductor Adobe Flash para visualizar vídeo en Internet.
Utiliza el códec Sorenson Spark y el códec On2 VP6. Ambos permiten una alta calidad visual con bitrates
reducidos.
Son archivos de extensión *.FLV.
Se pueden reproducir desde distintos reproductores locales: MPlayer, VLC media player, Riva, Xine, etc.
Opción recomendada para la web por su accesibilidad. Al visualizarse a través del reproductor de Flash es
accesible desde la mayoría de los sistemas operativos y navegadores web.
Los repositorios de vídeo más conocidos en Internet utilizan este formato para la difusión de vídeos:
YouTube, TeacherTube, Metacafe, etc.
Permite configurar distintos parámetros del vídeo para conseguir una aceptable calidad/peso.
Admite streaming. Junto con el formato MP4 son las opciones más aconsejables para la difusión de vídeos
por Internet.

Actividad

Echa un vistazo al servicio de Listas de RedIRIS (http://www.rediris.es/list/). Localiza algún tema


de tu interés dentro del directorio y suscríbete.
Fíjate en el tipo de lista que es.
Si quisieras darte de baja, ¿qué tendrías que hacer?
Entra en el servicio de listas de distribución de Google (Google Groups) y crea una lista con tus
compañeros. Tu serás el administrador y tus compañeros los usuarios.
Echa un vistazo al servicio de listas eListas.net (http://elistas.net) o Yahoo Grupos
(http://es.egroups.com). Pruébalos.
Ahora busca algún otro servicio en Internet.

9 de 20
Unidad 8

Tecnología de streaming

Introducción

En la navegación por Internet es necesario descargar previamente el archivo (página HTML, imagen JPG, audio
MP3, etc.) desde el servidor remoto al cliente local para luego visualizarlo
en la pantalla de este último.
La tecnología de streaming se utiliza para optimizar la descarga y reproducción de archivos de audio y vídeo que
suelen tener un cierto peso. Es una tecnología (también conocida como media-flujo) que permite la distribución de
archivos multimedia (principalmente audio y video) a través de la red de ordenadores en tiempo real. Estos son
cargados en un buffer de datos donde se puedan reproducir al mismo tiempo que se descargan y luego se
descartan, sin quedar almacenados en el disco duro del cliente.

Para hacer uso de esta tecnología, se necesita por lo menos tener un ancho de banda mínimo igual a la tasa de
transferencia del servidor, de lo contrario se producirían cortes y la
calidad de reproducción se verá afectada, que es justamente lo que esta tecnología no quiere, ya que busca un
flujo continuo de archivos.

Antes de la aparición de esta tecnología, la reproducción de contenido multimedia a través de Internet implicaba
descargar completamente el archivo al disco duro local. Como estos archivos multimedia son de gran tamaño, su
descarga y acceso como paquetes completos resultaba un mecanismo lento.

A grandes rasgos, el streaming funciona de la siguiente forma:

Conexión con el servidor. El reproductor cliente conecta con el servidor remoto y éste comienza a enviarle
el archivo.
Buffer. El cliente comienza a recibir el fichero y construye un buffer o almacén donde empieza a
guardarlo.
Inicio de la reproducción. Cuando el buffer se ha llenado con una pequeña fracción inicial del archivo
original, el reproductor cliente comienza a mostrarlo mientras continúa en segundo plano con el resto de la
descarga.
Caídas de la velocidad de conexión. Si la conexión experimenta ligeros descensos de velocidad durante la
reproducción, el cliente podría seguir mostrando el contenido consumiendo la información almacenada en
el buffer. Si llega a consumir todo el buffer se detendría hasta que se volviera a llenar.

10 de 20
Unidad 8

El streaming puede ser de dos tipos dependiendo de la tecnología instalada en el servidor:

Descarga progresiva. Se produce en servidores web. El archivo de vídeo o audio solicitado por el cliente
es liberado por el servidor como cualquier otro archivo utilizando el protocolo HTTP. Sin embargo, si el
archivo ha sido especialmente empaquetado para streaming, al ser leído por el reproductor cliente, se
iniciará en streaming en cuanto se llene el buffer.
Transmisión por secuencias. Se produce en servidores multimedia que disponen de un software
especial para gestionar más óptimamente el streaming de audio y vídeo: Windows Media Server, Flash
Communication Server, etc. La utilización de un servidor multimedia ofrece múltiples ventajas frente al
servidor web.
Las más destacadas son:
Mayor rapidez en la visualización de este tipo de contenidos.
La comunicación entre servidor/cliente se puede realizar por protocolos alternativos al HTTP. Tiene
el inconveniente del bloqueo impuesto por firewalls pero tiene la ventaja de una mayor rapidez.
Mejor gestión del procesador y ancho de banda de la máquina del servidor ante peticiones
simultáneas de varios clientes del mismo archivo de audio o vídeo.
Control predefinido sobre la descarga que pueden realizar los clientes: autentificada, filtrada por IP,
sin almacenarla en la caché del cliente, etc.
Mayor garantía de una reproducción ininterrumpida gracias al establecimiento de una conexión de
control inteligente entre servidor y cliente.
Posibilidad de distribución de transmisiones de audio y vídeo en directo.

Componentes de la tecnología

Los componentes básicos de un sistema Streaming son:

Codecs : son archivos residentes en el Host cliente que interpretan el contenido multimedia y hacen
posible su reproducción.
Protocolos: HTTP, RTSP, RTP, RTCP, TCP, UDP. Siendo los protocolos UDP, RTSP (Real Time Transffer
Protocol) los mas importantes, ya que hacen que la entrega de paquetes de datos desde el servidor al
cliente sea con una velocidad mucho mayor que con los protocolos HTTP y TCP (aplicaciones tolerante a
perdidas).
Precarga: el cliente precarga o almacena el archivo multimedia en un buffer de datos antes de
reproducirlo, con el fin de evitar interrupciones y mala calidad de reproducción debido a la congestión de la
red (Lag).
Red de datos: Si un determinado contenido comienza a atraer una cantidad de usuarios mayor que su
capacidad de Ancho de Banda, estos usuarios sufrirán interrupciones (también conocido como Lag).
Finalmente, se llega a un punto en que la calidad del Stream es pésima.
Segmentación: la información multimedia es segmentada, para luego ser enviada como paquetes a la
red. El cliente los recibe y reproduce inmediatamente.

11 de 20
Unidad 8

Servicios

La tecnología Streaming permite ofrecer múltiples servicios:

En directo (Live): Similar a un canal de televisión o una estación de radio.


Esta orientado a la multidifusion (unicast o multicast): unicast (se envía un flujo de información a
cada usuario) o multicast (se envía un flujo único de información)

El servidor comienza a transmitir en un instante dado.


Los usuarios ver la información que se esta emitiendo.
En este tipo de servicio no existe interacción.
Únicamente se le permite realizar pausas(cuando el usuario recupere la reproducción podrá ver la
información que se está transmitiendoen ese instante)

Bajo demanda(On-Demand): Similar a un reproductor de vídeo:


Los usuarios solicitan el envío del archivo en cualquier instante, no necesitan esperar a que el
servidor lo transmita.
Es Punto a Punto (Unicast: envío de flujo a cada usuario). Ejemplo: YouTube, Vimeo, Netflix, etc.
El usuario puede interactuar (pausar, avanzar, retroceder, etc.)

Casi bajo demanda (Near on Demand): simula el funcionamiento de un servicio bajo demanda con flujos
de vídeo en directo. Requiere de una red de comunicaciones de muy alta velocidad y es especialmente
interesante si se dispone de emisión multicast. Este tipo de streaming es similar a la incipiente televisión
interactiva.

Arquitectura

Entre las arquitecturas que emplea Streaming podemos encontrar:

Arquitectura Típica: usa la arquitectura típica Cliente-Servidor. Los protocolos mas usados son:
Sin control sobre la transmicion: HTTP.
Con control sobre la transmisión:
- Capa de Aplicación: RTSP(Real Time Streaming Protocol) es el protocolo responsable de la
entrega de datos y audio en tiempo real, no orientado a conexión, donde el control y reenvío de
datos corre a cargo de TCP; MMS(Microsoft Media Server), RTMP(Real Time Messaging Protocol)
y RTMFP(Real Time Media Flow Protocol).
- Capa de Transporte: RTP(Real Time Transport Protocol), UDP y TCP.

Arquitectura Sin Servidor(Server-Less): En este caso no existe un servidor de Audio-Video, el archivo se


le proporciona al cliente mediante un servidor Web (pseudo-streaming). Usa los Protocolos TCP y HTTP.
No permite interactividad ni existe control del flujo de datos por parte del cliente.
Arquitectura sin cliente (Client-Less): no hay programa cliente. Éste estará incrustado en otra aplicación
como por ejemplo plugin de Java o de Flash. Otro ejemplo serían las nuevas especificaciones de HTML5
donde existen codecs que reproducen multimedia sin necesidad abrir un reproductor especifico.

Elementos

12 de 20
Unidad 8

Entre los elementos que componen la arquitectura de Streaming podemos encontrar:

Los sistemas de producción.


Es donde se genera el Flujo de datos (Stream). El flujo de datos puede ser recogido de un sistema de
almacenamiento para su emisión o captado en directo mediante videocámaras, webcam, grabadores de
audio, etc.
En el sistema de producción es donde se genera la paquetización donde los datos son divididos en
segmentos que son enviados para su reproducción.
Los formatos de audio/video usados comúnmente para la tecnología Streaming son, según sus
propietarios (servidores): Real Networks (Real Media, Real Video, Real Audio), Microsoft (Windows Media
Video .WMV, Advanced Streaming Format),Apple (Movie.MOV, Quick Time), Adobe (Shockwave Flash
.SWF, Flash Video.FLV), Otros (MPEG, MP4, etc.).
Servidor proxy.
Muchas veces es necesario instalar un Servidor Proxy para proporcionar una mejor calidad de servicio
Streaming.
Por ejemplo, en el tipo de servicio OnDemand, el servidor Proxy es el responsable de transmitir el archivo
solicitado por el cliente si lo tiene en su caché, reduciendo considerablemente el retardo de transmisión de
la información. En el tipo de servicio En directo, el servidor manda el Stream al servidor Proxy y éste
reenvía el Stream a los clientes.
Protocolos de conexión.
En un proceso de comunicación Streaming se establecen dos conexiones a nivel de la capa de transporte
entre el cliente y servidor. La primera es para el canal de
control (bidireccional), donde se hacen las interacciones del cliente y el servidor y el otro es para el canal
para el envío de datos multimedia, donde el servidor
transmite la información (Stream).
Por ejemplo, el protocolo más usado es el RTSP. Este sería el esquema de conexión:

Clientes de streaming.
Permiten a los usuarios acceder a los recursos multimedia ofrecidos en los servidores de streaming para
ser reproducidos con la ayuda de codecs.
El cliente dispondrá de un buffer para almacenar de forma temporal los datos que va recibiendo desde el
servidor. Con ello, se pretende evitar problemas de flujo como jitter (variabilidad de la transmisión de los
paquetes debido a eventuales problemas en la línea que pueden generar cortes).

13 de 20
Unidad 8

Protocolo RTSP

Es el protocolo de la capa de aplicación responsable de la transmisión de los datos de audio y video en tiempo
real [RFC2326].
RTSP es un protocolo no orientado a conexión, en lugar de esto el servidor mantiene una sesión asociada a un
identificador. En la mayoría de los casos RTSP usa TCP para el canal de control del reproductor y UDP para el
canal de envió de datos de audio y vídeo.

Utiliza los puertos 554/UDP y 554/TCP.

Soporta mecanismos de seguridad (TLS/SSL) y autenticación HTTP 1.1.

En una sesión RTSP, el cliente puede abrir y cerrar varias conexiones de transporte hacia el servidor con tal de
satisfacer las necesidades del protocolo. El flujo de datos hacia el cliente puede provenir de varios servidores
RTSP. El protocolo RTSP es bastante similar al protocolo HTTP pero, al contrario de HTTP, el servidor RTSP
necesita mantener el estado de la
conexión. Tanto el cliente como el servidor pueden mandar peticiones y los datos son transportados por un
protocolo diferente.

El protocolo RTSP tiene algunas propiedades importantes:

Extensible: se pueden agregar nuevos parámetros fácilmente RSTP.


Seguro: RTSP reutiliza mecanismos de seguridad web ya sea de los protocolos de transporte (TLS) o
dentro del mismo protocolo.
Capacidad multi-servidor. Cada flujo multimedia dentro de una presentación puede residir en servidores
diferentes, el cliente automáticamente establece varías sesiones concurrentes de control con los diferentes
servidores, la sincronización la lleva a término la capa de transporte.
Control de dispositivos de grabación. El protocolo puede controlar dispositivos de grabación y
reproducción (p.ej cámaras IP RTSP).
Adecuado para aplicaciones profesionales: RTSP soporta resolución a nivel de frame mediante marcas
temporales SMPTE para permitir edición digital.

Peticiones RTSP

Las peticiones RTSP generalmente son enviadas del cliente al servidor. A continuación se describen la más
típicas:

DESCRIBE: Este método obtiene una descripción de una presentación o del objeto multimedia apuntado
por una URL RTSP situada en un servidor.
El servidor responde a esta petición con una descripción del recurso solicitado, entre otros datos la
descripción contiene una lista de los flujos multimedia que serán necesarios para la reproducción. Esta
solicitud/respuesta constituye la fase de inicialización del RTSP.
SETUP: Especifica cómo será transportado el flujo de datos, la petición contiene la url del flujo multimedia
y una especificación de transporte, esta especificación típicamente incluye un puerto para recibir los datos
RTP (audio o vídeo), y otro para los datos RTCP(meta-datos).
El servidor responde confirmando los parámetros escogidos y llena las partes restantes, como los puertos

14 de 20
Unidad 8

escogidos por el servidor. Cada flujo de datos debe ser configurado con SETUP antes de enviar una
petición de PLAY.
RTCP es complementario a RTP. RTP es unidireccional servidor->cliente y es necesario una comunicación
cliente->servidor para que el cliente informe de ciertos datos importantes como, por ejemplo, número de
paquetes RTP perdidos.
PLAY : Una petición de PLAY provocará que el servidor comience a enviar datos de los flujos
especificados utilizando los puertos configurados con SETUP.
PAUSE: Detiene temporalmente uno o todos los flujos, de manera que puedan ser recuperados con un
PLAY posteriormente.
TEARDOWN: Detiene la entrega de datos para la URL indicada liberando los recursos asociados.

Clientes y servidores

Existen multitud de programas clientes para reproducción multimedia. Algunos son genéricos como VLC Media
Player (potente reproductor multimedia libre y gratuito), Real Player, Windows Media Player, Totem, Mplayer, etc.
o específicos como son los clientes de reproducción de música como Spotify, de estaciones de radio como
Screamer Radio, etc.

Mención a parte merecen los conocidos como Media Center o centros multimedia de entretenimiento como Kodi.

Por lo que respecta a servidores de streaming existen también bastantes alternativas. Veamos algunas de ellas:

ShoutCast Server: streaming de radio en directo.


VideoLAN Server: streaming de video unicast y multicast.
IceCast: streaming de audio.
SopCast: servidor de streaming P2P.
Windows Media Server: la solución de streaming de Microsoft.
etc.

Actividad

Busca información sobre el Media Center Kodi. ¿Qué permite reproducir? ¿Sistemas en los que se
puede instalar?
Busca otros Media Center del mercado libres y propietarios.
Busca información sobre el término podcast. Indica alguna página en Internet que ofrezca servicio
de podcast.

15 de 20
Unidad 8

Tecnología de voz IP

Introducción

VoIP proviene del ingles Voice Over Internet Protocol (voz sobre protocolo de internet). Se trata de una tecnología
que es capaz de enviar la señal de voz en forma digital, en paquetes de datos, en lugar de enviarla en forma
analógica a través de los circuitos de la telefonía convencional.

El VoIP permite la unión de dos mundos históricamente separados, el de la transmisión de voz y el de la


transmisión de datos. VoIP puede transformar una conexión a internet en una plataforma para realizar llamadas
gratuitas por Internet.

Los Protocolos que se usan para enviar las señales de voz sobre la red IP se conocen como protocolos de Voz
sobre IP. El tráfico de Voz sobre IP puede circular por cualquier red IP, incluyendo redes de área local y redes
WAN como Internet

Es muy importante diferenciar entre Voz sobre IP (VoIP) y Telefonía sobre IP.

VoIP es el conjunto de normas, dispositivos, protocolos, en definitiva la tecnología que permite comunicar
voz sobre el protocolo IP.
Telefonía sobre IP es el servicio telefónico disponible al público, hace uso de la tecnología de VoIP.

Ventajas

La principal ventaja de este tipo de servicios es que evita los cargos altos de telefonía (principalmente de
larga distancia) que son usuales de las compañías de la Red Pública Telefónica Conmutada (PSTN). Las
llamadas de VoIP a VoIP entre cualquier proveedor son generalmente gratis en contraste con las llamadas
de VoIP a PSTN que generalmente cuestan al usuario de VoIP.
El desarrollo de codecs para VoIP (aLaw, G.729, G.723, etc.) ha permitido que la voz se codifique en
paquetes de datos cada vez más pequeños. Esto deriva en que las comunicaciones de voz sobre IP
requieran anchos de banda muy reducidos. Junto con el avance permanente de las conexiones ADSL
en el mercado residencial, éste tipo de comunicaciones están siendo muy populares para llamadas
internacionales.
Con VoIP uno puede realizar una llamada desde cualquier lugar donde exista conectividad a Internet.
Esto es una ventaja para las personas que suelen viajar mucho.
La mayoría de los proveedores de VOIP ofrecen características a sus usuarios que en la telefonía
convencional se cobrarían como funciones extra. Un servicio de VOIP incluye generalmente: identificación
de llamadas, servicio de llamadas en espera, servicio de transferencia de llamadas, repetir llamada,
devolver llamada, llamada de 3 líneas (three-way calling).

Desventajas

Calidad de la llamada. Es un poco inferior a la telefónica ya que los datos viajan en forma de paquetes;
se pueden tener algunas perdidas de información y demora en la transmisión. El problema en sí de la VoIP
no es el protocolo sino la red IP, ya que esta no fue pensada para dar algún tipo de garantías.
La calidad de una conexión VoIP se puede ver afectada por problemas como la alta latencia (tiempo de
respuesta) o la perdida de paquetes. Las conversaciones telefónicas se pueden ver distorsionadas o
incluso cortadas por este tipo de problemas. Es indispensable para establecer conversaciones VOIP
satisfactorias contar con una cierta estabilidad y calidad en la línea de datos.
Robos de Datos. Un cracker puede tener acceso al servidor de VoIP y a los datos de voz almacenados y
al propio servicio telefónico para escuchar conversaciones o hacer llamadas gratuitas a cargo de los

16 de 20
Unidad 8

usuarios.
Virus en el sistema y otros problemas de seguridad. En el caso en que un virus infecta algún equipo de
un servidor VoIP, el servicio telefónico puede quedar interrumpido. También pueden verse afectados otros
equipos que estén conectados al sistema.
Además, pueden producirse suplantaciones de ID.
VoIP requiere de una conexión de banda ancha.
VoIP requiere de una conexión eléctrica.
En los casos en que se utilice un softphone (software que permite realizar llamadas a través de un equipo
conectado a Internet) la calidad de la comunicación VOIP puede verse afectada por el propio equipo
donde se ejecuta; imaginemos que estamos realizando una llamada y en un determinado momento se
abre un programa que utiliza el 100% de la capacidad de nuestra CPU, en este caso critico la calidad de la
comunicación VOIP se puede ver comprometida porque el procesador se encuentra trabajando a tiempo
completo, por eso, es recomendable utilizar un buen equipo junto con su configuración voip.

De todos modos, con la evolución tecnológica actual, la telefonía IP va a superar estos problemas, y se estima
que reemplaze a la telefonía convencional a corto-medio plazo.

Elementos

Los clientes
El cliente establece y origina las llamadas realizadas de voz, esta información se recibe a través del
micrófono del usuario (entrada de información , ) se codifica, se empaqueta y, de la misma forma, esta
información se decodifica y reproduce a través de los altavoces (salida de la información) del otro
interlocutor.
Un cliente puede ser un software (softphone) o un dispositivo físico (hardphone: un teléfono IP o un
equipo ATA (adaptador de teléfono analógico para convertirlo IP))

Los servidores (centralitas IP)


Las centralitas IP también denominados conmutadores IP o IP-PBX realizan las mismas funciones que las
centralitas de teléfonos convencionales: centralizar y gestionar las llamadas entre los dispositivos
conectados. También realizará la función de intermediación entre la red IP interna y la línea telefónica
externa. De hecho, las centralitas tienen 2 tipos de puertos: FXO (Foreign eXchange Office - para la
conexión a la linea telefónica convencional) y FXS (Foreign eXchange Station - para la conexión de
teléfonos IP).
Podemos diferenciar 2 tipos de centralitas:
Las centralitas Hardware. Existen diversos fabricantes como BT, Alcatel, Mitel, etc.
Las centralitas Software. Se incorpora un software específico a un equipo que dispondrá a nivel
hardware de las tarjetas de red adecuadas. Implementaciones de este tipo hay muchas: Asterisk
(de código abierto y uno de los más usados), 3CX o Microsoft Lync Server.
Gateways: dispositivos de red que hacen de pasarela entre la red IP y linea telefónica.
Protocolos. Los vemos en el siguiente punto.

Protocolos

El objetivo del protocolo de VoIP es dividir en paquetes los flujos de audio para transportarlos sobre redes
basadas en IP.

Los protocolos de las redes IP originalmente no fueron diseñados para enviar flujo en tiempo real de audio. Por
ello, se crearon los protocolos para voip, cuyo mecanismo de conexión abarca una serie de transacciones de
señalización entre terminales que cargan dos flujos de audio para cada dirección de la conversación.

Algunos de los protocolos voip (compatibles con Asterisk PBX) más importantes son:

17 de 20
Unidad 8

SIP

SIP (Session Initiation Protocol) es un protocolo de señalización para conferencia, telefonía, presencia,
notificación de eventos y mensajería instantánea a través de Internet. Fue desarrollado inicialmente en el grupo de
trabajo IETF MMUSIC (Multiparty Multimedia Session Control) y, a partir de Septiembre de 1999, pasó al grupo de
trabajo IETF SIP.

Acrónimo de “Session Initiation Protocol”.


Este protocolo considera a cada conexión como un par y se encarga de negociar las capacidades entre
ellos.
Tiene una sintaxis simple, similar a HTTP o SMTP.
Posee un sistema de autenticación de pregunta/respuesta.
Tiene métodos para minimizar los efectos de DoS (Denial of Service o Denegación de Servicio), que
consiste en saturar la red con solicitudes de invitación.
Utiliza un mecanismo seguro de transporte mediante TLS.
No tiene un adecuado direccionamiento de información para el funcionamiento con NAT.

IAX

Acrónimo de “Inter Asterisk eXchange”.


IAX es un protocolo abierto, es decir, que se puede descargar y desarrollar libremente.
Aún no es un estándar.
Es un protocolo de transporte, que utiliza el puerto UDP 4569 tanto para señalización de canal como para
el flujo de datos con RTP (Protocolo de Transporte en tiempo Real).
Puede truncar o empaquetar múltiples sesiones dentro de un flujo de datos, así requiere de menos ancho
de banda y permite mayor número de canales entre terminales.
En seguridad, permite la autenticación, pero no hay cifrado entre terminales.
Según la documentación (Asterisk 1.4) el IAX puede usar cifrado (aes128), siempre sobre canales con
autenticación MD5.

H.323

Originalmente fue diseñado para el transporte de vídeoconferencia.


Su especificación es compleja.
H.323 es un protocolo relativamente seguro. Utiliza RTP.
Al igual que SIP tiene dificultades con NAT, por ejemplo, para recibir llamadas se necesita direccionar el
puerto TCP 1720 al cliente, además de direccionar los puertos UDP para los flujos de datos de RTP y los
flujos de control de RTCP.

Actividad

Busca proveedores del servicio voIP. ¿Qué tarifas tienen? Compáralas con el coste de las
llamadas a través la red telefónica convencional (escoge cualquier operador para hacer la
comparación).

18 de 20
Unidad 8

Servicios de videoconferencia

Introducción

Videoconferencia o videollamada es la comunicación simultánea bidireccional de audio y vídeo, que permite


mantener reuniones con grupos de personas situadas en lugares alejados entre sí. Adicionalmente, pueden
ofrecerse facilidades telemáticas o de otro tipo como el intercambio de gráficos, imágenes fijas, transmisión de
ficheros desde el ordenador, etc.

En la actualidad, se han superado muchas de las limitaciones técnicas (el sonido deficiente, la mala calidad de las
imágenes, la poca fiabilidad, la complejidad y el costo) que existían en los inicios de esta tecnología dando paso
videoconferencias de alta calidad.

La característica principal que ofrece la videoconferencia es la posibilidad de ver y oír simultáneamente a el/los
interlocutor/es. Esta tecnología puede utilizarse para realizar videollamadas persona a persona o incluyo realizar
reuniones con multitud de participantes.

Una de la mayores ventajas que no proporciona la videoconferencia es el ahorro en costes tanto en tiempo como
en dinero. Una reunión virtual entre personas que están ubicadas en lugares muy dispares geográficamente evita
gran cantidad de desplazamientos.

Estas ventajas hacen a la videoconferencia el segmento de mayor crecimiento en el área de las


telecomunicaciones.

Existen numerosas herramientas que permiten realizar videoconferencias o videollamadas. Algunas son
totalmente gratuitas. Es el caso de Skype (una de las herramientas más populares en todo el mundo), Hangouts
de Google o Ekiga.

Respecto a soluciones para montar nuestro propio sistema de videoconferencia tenemos a nuestra disposición el
servidor TrueConf Server con su correspondientes cliente Trueconf Client.

Por ultimo, no hay que olvidar la plataforma WebEx de la compañía Cisco. Un sistema muy potente y flexible que
permite todo tipo de reuniones online.

19 de 20
Unidad 8

Actividad

Prueba el servicio Ekiga y compáralo con Hangouts o Skype.

20 de 20

También podría gustarte