Está en la página 1de 7

Teora de la informacin

Teora de la informacin
La teora de la informacin, tambin conocida como teora matemtica de la comunicacin (Mathematical Theory of Communication) o teora matemtica de la informacin, es una propuesta terica presentada por Claude E. Shannon y Warren Weaver a finales de la dcada de los aos 1940. Esta teora est relacionada con las leyes matemticas que rigen la transmisin y el procesamiento de la informacin y se ocupa de la medicin de la informacin y de la representacin de la misma, as como tambin de la capacidad de los sistemas de comunicacin para transmitir y procesar informacin.[1] La Teora de la Informacin es una rama de la teora matemtica y de las ciencias de la computacin que estudia la informacin y todo lo relacionado con ella: canales, compresin de datos, criptografa y temas relacionados.

Historia
La teora de la informacin surgi a finales de la Segunda Guerra Mundial, en los aos cuarenta. Fue iniciada por Claude E. Shannon a travs de un artculo publicado en el Bell System Technical Journal en 1948, titulado Una teora matemtica de la comunicacin (texto completo en ingls [2]). En esta poca se buscaba utilizar de manera ms eficiente los canales de comunicacin, enviando una cantidad de informacin por un determinado canal y midiendo su capacidad; se buscaba la transmisin ptima de los mensajes. Esta teora es el resultado de trabajos comenzados en la dcada 1910 por Andrei A. Markovi, a quien le sigui Ralp V. L. Hartley en 1927, quien fue el precursor del lenguaje binario. A su vez, Alan Turing en 1936, realiz el esquema de una mquina capaz de tratar informacin con emisin de smbolos, y finalmente Shannon, matemtico, ingeniero electrnico y criptgrafo americano conocido como "el padre de la teora de la informacin, junto a Warren Weaver, contribuy en la culminacin y el asentamiento de la Teora Matemtica de la Comunicacin de 1949 que hoy es mundialmente conocida por todos como la Teora de la Informacin-. Weaver consigui darle un alcance superior al planteamiento inicial, creando un modelo simple y lineal: Fuente/codificador/mensaje canal/descodificador/destino. La necesidad de una base terica para la tecnologa de la comunicacin surgi del aumento de la complejidad y de la masificacin de las vas de comunicacin, tales como el telfono, las redes de teletipo y los sistemas de comunicacin por radio. La teora de la informacin tambin abarca todas las restantes formas de transmisin y almacenamiento de informacin, incluyendo la televisin y los impulsos elctricos que se transmiten en las computadoras y en la grabacin ptica de datos e imgenes. La idea es garantizar que el transporte masivo de datos no sea en modo alguno una merma de la calidad, incluso si los datos se comprimen de alguna manera. Idealmente, los datos se pueden restaurar a su forma original al llegar a su destino. En algunos casos, sin embargo, el objetivo es permitir que los datos de alguna forma se convierten para la transmisin en masa, se reciban en el punto de destino y sean convertidos fcilmente a su formato original, sin perder ninguna de la informacin transmitida.[3]

Desarrollo de la teora
El modelo propuesto por Shannon es un sistema general de la comunicacin que parte de una fuente de informacin desde la cual, a travs de un transmisor, se emite una seal, la cual viaja por un canal, pero a lo largo de su viaje puede ser interferida por algn ruido. La seal sale del canal, llega a un receptor que decodifica la informacin convirtindola posteriormente en mensaje que pasa a un destinatario. Con el modelo de la teora de la informacin se trata de llegar a determinar la forma ms econmica, rpida y segura de codificar un mensaje, sin que la presencia de algn ruido complique su transmisin. Para esto, el destinatario debe comprender la seal correctamente; el problema es que aunque exista un mismo cdigo de por medio, esto no significa que el destinatario va a captar el significado que el emisor le quiso dar al mensaje. La codificacin puede referirse tanto a la transformacin de voz o imagen en seales elctricas o electromagnticas, como al cifrado de mensajes para asegurar su privacidad. Un concepto fundamental en la teora de la informacin es que la cantidad de informacin contenida en un mensaje es un valor matemtico bien definido y medible. El trmino cantidad no se refiere a la cuanta de datos, sino a la

Teora de la informacin probabilidad de que un mensaje, dentro de un conjunto de mensajes posibles, sea recibido. En lo que se refiere a la cantidad de informacin, el valor ms alto se le asigna al mensaje que menos probabilidades tiene de ser recibido. Si se sabe con certeza que un mensaje va a ser recibido, su cantidad de informacin es 0. [4]

Finalidad
Otro aspecto importante dentro de esta teora es la resistencia a la distorsin que provoca el ruido, la facilidad de codificacin y descodificacin, as como la velocidad de transmisin. Es por esto que se dice que el mensaje tiene muchos sentidos, y el destinatario extrae el sentido que debe atribuirle al mensaje, siempre y cuando haya un mismo cdigo en comn. La teora de la informacin tiene ciertas limitantes, como lo es la acepcin del concepto del cdigo. El significado que se quiere transmitir no cuenta tanto como el nmero de alternativas necesario para definir el hecho sin ambigedad. Si la seleccin del mensaje se plantea nicamente entre dos alternativas diferentes, la teora de Shannon postula arbitrariamente que el valor de la informacin es uno. Esta unidad de informacin recibe el nombre de bit. Para que el valor de la informacin sea un bit, todas las alternativas deben ser igual de probables y estar disponibles. Es importante saber si la fuente de informacin tiene el mismo grado de libertad para elegir cualquier posibilidad o si se halla bajo alguna influencia que la induce a una cierta eleccin. La cantidad de informacin crece cuando todas las alternativas son igual de probables o cuanto mayor sea el nmero de alternativas. Pero en la prctica comunicativa real no todas las alternativas son igualmente probables, lo cual contribuye un tipo de proceso estocstico denominado Markoff. El subtipo de Markoff dice que la cadena de smbolos est configurada de manera que cualquier secuencia de esa cadena es representativa de toda la cadena completa.

Teora aplicada a la tecnologa


La Teora de la Informacin se encuentra an hoy en da en relacin con una de las tecnologas en boga, Internet. Desde el punto de vista social, Internet representa unos significativos beneficios potenciales, ya que ofrece oportunidades sin precedentes para dar poder a los individuos y conectarlos con fuentes cada vez ms ricas de informacin digital. Internet fue creado a partir de un proyecto del departamento de defensa de los Estados Unidos llamado DARPANET (Defense Advanced Research Project Network) iniciado en 1969 y cuyo propsito principal era la investigacin y desarrollo de protocolos de comunicacin para redes de rea amplia para ligar redes de transmisin de paquetes de diferentes tipos capaces de resistir las condiciones de operacin ms difciles, y continuar funcionando an con la prdida de una parte de la red (por ejemplo en caso de guerra). Estas investigaciones dieron como resultado el protocolo TCP/IP (Transmission Control Protocol/Internet Protocol), un sistema de comunicaciones muy slido y robusto bajo el cual se integran todas las redes que conforman lo que se conoce actualmente como Internet. El enorme crecimiento de Internet se debe en parte a que es una red basada en fondos gubernamentales de cada pas que forma parte de Internet, lo que proporciona un servicio prcticamente gratuito. A principios de 1994 comenz a darse un crecimiento explosivo de las compaas con propsitos comerciales en Internet, dando as origen a una nueva etapa en el desarrollo de la red. Descrito a grandes rasgos, TCP/IP mete en paquetes la informacin que se quiere enviar y la saca de los paquetes para utilizarla cuando se recibe. Estos paquetes pueden comparaser con sobres de correo; TCP/IP guarda la informacin, cierra el sobre y en la parte exterior pone la direccin a la cual va dirigida y la direccin de quien la enva. Mediante este sistema, los paquetes viajan a travs de la red hasta que llegan al destino deseado; una vez ah, la computadora de destino quita el sobre y procesa la informacin; en caso de ser necesario enva una respuesta a la computadora de origen usando el mismo procedimiento. Cada mquina que est conectada a Internet tiene una direccin nica; esto hace que la informacin que se enva no equivoque el destino. Existen dos formas de dar direcciones, con letras o con nmeros. Realmente, las computadoras utilizan las direcciones numricas para mandar paquetes de informacin, pero las direcciones con letras fueron implementadas para facilitar su manejo a los seres humanos. Una direccin con letras consta de dos a cuatro partes. Una direccin numrica est compuesta por cuatro partes. Cada una de estas partes est dividida por puntos.

Teora de la informacin Ejemplo: sedet.com.mx 107.248.185.1 microsoft.com198.105.232.6

Una de las aplicaciones de la teora de la informacin son los archivos ZIP, documentos que se comprimen para su transmisin a travs de correo electrnico o como parte de los procedimientos de almacenamiento de datos. La compresin de los datos hace posible completar la transmisin en menos tiempo. En el extremo receptor, un software se utiliza para la liberacin o descompresin del archivo, restaurando los documentos contenidos en el archivo ZIP a su formato original. La teora de la informacin tambin entra en uso con otros tipos de archivos; por ejemplo, los archivos de audio y vdeo que se reproducen en un reproductor de MP3 se comprimen para una fcil descarga y almacenamiento en el dispositivo. Cuando se accede a los archivos se amplan para que estn inmediatamente disponibles para su uso.[5]

Elementos de la Teora
Fuente
Una fuente es todo aquello que emite mensajes. Por ejemplo, una fuente puede ser una computadora y mensajes sus archivos; una fuente puede ser un dispositivo de transmisin de datos y mensajes los datos enviados, etc. Una fuente es en s misma un conjunto finito de mensajes: todos los posibles mensajes que puede emitir dicha fuente. En compresin de datos se tomar como fuente el archivo a comprimir y como mensajes los caracteres que conforman dicho archivo.

Esquema de la comunicacin ideado por Claude E. Shannon.

Tipos de fuente
Por la naturaleza generativa de sus mensajes, una fuente puede ser aleatoria o determinstica. Por la relacin entre los mensajes emitidos, una fuente puede ser estructurada o no estructurada (o catica). Existen varios tipos de fuente. Para la teora de la informacin interesan las fuentes aleatorias y estructuradas. Una fuente es aleatoria cuando no es posible predecir cul es el prximo mensaje a emitir por la misma. Una fuente es estructurada cuando posee un cierto nivel de redundancia; una fuente no estructurada o de informacin pura es aquella en que todos los mensajes son absolutamente aleatorios sin relacin alguna ni sentido aparente. Este tipo de fuente emite mensajes que no se pueden comprimir; un mensaje, para poder ser comprimido, debe poseer un cierto nivel de redundancia; la informacin pura no puede ser comprimida sin que haya una prdida de conocimiento sobre el mensaje.[6]

Teora de la informacin

Mensaje
Un mensaje es un conjunto de ceros y unos. Un archivo, un paquete de datos que viaja por una red y cualquier cosa que tenga una representacin binaria puede considerarse un mensaje. El concepto de mensaje se aplica tambin a alfabetos de ms de dos smbolos, pero debido a que tratamos con informacin digital nos referiremos casi siempre a mensajes binarios.

Cdigo
Un cdigo es un conjunto de unos y ceros que se usan para representar un cierto mensaje de acuerdo a reglas o convenciones preestablecidas. Por ejemplo al mensaje 0010 lo podemos representar con el cdigo 1101 usando para codificar la funcin (NOT). La forma en la cual codificamos es arbitraria. Un mensaje puede, en algunos casos, representarse con un cdigo de menor longitud que el mensaje original. Supongamos que a cualquier mensaje S lo codificamos usando un cierto algoritmo de forma tal que cada S es codificado en L(S) bits; definimos entonces la informacin contenida en el mensaje S como la cantidad mnima de bits necesarios para codificar un mensaje.

Informacin
La informacin contenida en un mensaje es proporcional a la cantidad de bits que se requieren como mnimo para representar al mensaje. El concepto de informacin puede entenderse ms fcilmente si consideramos un ejemplo. Supongamos que estamos leyendo un mensaje y hemos ledo "string of ch"; la probabilidad de que el mensaje contine con "aracters" es muy alta. Por lo tanto, cuando realmente leemos "aracters" del archivo la cantidad de informacin que recibimos es muy baja pues estbamos en condiciones de predecir que era lo que iba a ocurrir. La ocurrencia de mensajes de alta probabilidad de aparicin aporta menos informacin que la ocurrencia de mensajes menos probables. Si luego de "string of ch" leemos "imichurri" la cantidad de informacin que recibimos es mucho mayor.

Entropa e informacin
La informacin es tratada como magnitud fsica, caracterizando la informacin de una secuencia de smbolos utilizando la entropa. Se parte de la idea de que los canales no son ideales, aunque muchas veces se idealicen las no linealidades, para estudiar diversos mtodos de envo de informacin o la cantidad de informacin til que se pueda enviar a travs de un canal. La informacin necesaria para especificar un sistema fsico tiene que ver con su entropa. En concreto, en ciertas reas de la fsica, extraer informacin del estado actual de un sistema requiere reducir su entropa, de tal manera que la entropa del sistema y la cantidad de informacin extrable estn relacionadas por:

Entropa de una fuente


De acuerdo a la teora de la informacin, el nivel de informacin de una fuente se puede medir segn la entropa de la misma. Los estudios sobre la entropa son de suma importancia en la teora de la informacin y se deben principalmente a C. E. Shannon. Existe, a su vez, un gran nmero de propiedades respecto de la entropa de variables aleatorias debidas a A. Kolmogorov. Dada una fuente "F" que emite mensajes, resulta frecuente observar que los mensajes emitidos no resulten equiprobables sino que tienen una cierta probabilidad de ocurrencia dependiendo del mensaje. Para codificar los mensajes de una fuente intentaremos pues utilizar menor cantidad de bits para los mensajes ms probables y mayor cantidad de bits para los mensajes menos probables, de forma tal que el promedio de bits utilizados para codificar los mensajes sea menor a la cantidad de bits promedio de los mensajes originales. Esta es la base de la compresin de datos. A este tipo de fuente se la denomina fuente de orden-0, pues la probabilidad de ocurrencia de un mensaje no depende de los mensajes anteriores. A las fuentes de orden superior se

Teora de la informacin las puede representar mediante una fuente de orden-0 utilizando tcnicas de modelizacin apropiadas. Definimos la probabilidad de ocurrencia de un mensaje en una fuente como la cantidad de apariciones de dicho mensaje dividido entre el total de mensajes. Supongamos que Pi es la probabilidad de ocurrencia del mensaje-i de una fuente, y supongamos que Li es la longitud del cdigo utilizado para representar a dicho mensaje. La longitud promedio de todos los mensajes codificados de la fuente se puede obtener como:

Promedio ponderado de las longitudes de los cdigos de acuerdo a sus probabilidades de ocurrencia, al nmero "H" se lo denomina "Entropa de la fuente" y tiene gran importancia. La entropa de la fuente determina el nivel de compresin que podemos obtener como mximo para un conjunto de datos, si consideramos como fuente a un archivo y obtenemos las probabilidades de ocurrencia de cada carcter en el archivo podremos calcular la longitud promedio del archivo comprimido, se demuestra que no es posible comprimir estadsticamente un mensaje/archivo ms all de su entropa. Lo cual implica que considerando nicamente la frecuencia de aparicin de cada carcter la entropa de la fuente nos da el lmite terico de compresin, mediante otras tcnicas no-estadsticas puede, tal vez, superarse este lmite. El objetivo de la compresin de datos es encontrar los Li que minimizan a "H", adems los Li se deben determinar en funcin de los Pi, pues la longitud de los cdigos debe depender de la probabilidad de ocurrencia de los mismos (los ms ocurrentes queremos codificarlos en menos bits). Se plantea pues:

A partir de aqu y tras intrincados procedimientos matemticos que fueron demostrados por Shannon oportunamente se llega a que H es mnimo cuando f(Pi) = log2 (1/Pi). Entonces:

La longitud mnima con la cual puede codificarse un mensaje puede calcularse como Li=log2(1/Pi) = -log2(Pi). Esto da una idea de la longitud a emplear en los cdigos a usar para los caracteres de un archivo en funcin de su probabilidad de ocurrencia. Reemplazando Li podemos escribir a H como:

De aqu se deduce que la entropa de la fuente depende nicamente de la probabilidad de ocurrencia de cada mensaje de la misma, por ello la importancia de los compresores estadsticos (aquellos que se basan en la probabilidad de ocurrencia de cada carcter). Shannon demostr, oportunamente que no es posible comprimir una fuente estadsticamente ms all del nivel indicado por su entropa. [7][8]

Otros aspectos de la teora


Fuentes de informacin Teorema de muestreo de Nyquist-Shannon Entropa Neguentropa Informacin mutua

Canales Capacidad Compresin de datos Codificacin de fuente

Teora de la informacin Cdigos no-singulares Cdigos unvocamente decodificables Extensin de cdigo Cdigos prefijo (o cdigos instantneos) Control de errores FEC ARQ Parada y espera Rechazo mltiple Rechazo selectivo Tcnicas hbridas Concatenacin de cdigos Tipo 1 Tipo 2 Deteccin de errores Bits de redundancia Mtodos de control de errores Paridad Cdigos autochequeo y autocorrectores Cdigos de bloque Distancia Hamming Paridad horizontal y vertical Cdigos lineales Cdigos cclicos CRC16 CRC32

Referencias
[1] [2] [3] [4] [5] Teora Matemtica de la Comunicacin (http:/ / tunastc3. tripod. com/ ts10/ ) http:/ / www. essrl. wustl. edu/ ~jao/ itrg/ shannon. pdf Teora Matemtica de la Comunicacin (http:/ / tunastc3. tripod. com/ ts10/ ) Teora de la Informacin (http:/ / www. entradagratis. com/ Enciclopedia-de-Comunicacion/ 3068/ Teoria-de-la-Informacion-pag. 1. htm) Teora Matemtico-informacional (http:/ / www. monografias. com/ trabajos59/ teoria-matematico-informacional/ teoria-matematico-informacional. shtml) [6] Teora de la Informacin | Textos Cientficos (http:/ / www. textoscientificos. com/ informacion/ teoria) [7] Teora de la Informacin (http:/ / www. textoscientificos. com/ informacion/ teoria) [8] Teora Matemtica de la Informacin (http:/ / cienciasempresariales. info/ teoria-matematica-de-la-informacion/ )

Fuentes y contribuyentes del artculo

Fuentes y contribuyentes del artculo


Teora de la informacin Fuente: http://es.wikipedia.org/w/index.php?oldid=67131881 Contribuyentes: 119-MAD2-X91.libre.retevision.es, 141-MAD2-X90.libre.retevision.es, 156-MAD2-X69.libre.retevision.es, 166-MAD2-X72.libre.retevision.es, Acratta, AstroNomo, BetoCG, CaesarExcelsus, Davius, Diegusjaimes, Earnaor, Edgar, Edub, Elisardojm, Eloy, Er Komandante, Execoot, Fercufer, Frandzi.rangel, Gbsuar, Interwiki, Ivan.Romero, Jesuja, Jkbw, Julian leonardo paez, LP, Lalaconyforever, Loekiller, ManuelGR, Nerika, Nicoletis, PACO, Paintman, Pompilio Zigrino, Rcamacho, Sebasg37, SuperBraulio13, Technopat, ULIF050020014, Ucevista, Valdrik, Velual, conversion script, 57 ediciones annimas

Fuentes de imagen, Licencias y contribuyentes


Archivo:Esquema de comunicacin Shannon.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Esquema_de_comunicacin_Shannon.png Licencia: Creative Commons Attribution-Sharealike 3.0 Contribuyentes: User:Nicoletis

Licencia
Creative Commons Attribution-Share Alike 3.0 Unported //creativecommons.org/licenses/by-sa/3.0/