Está en la página 1de 8

Universidad Abierta y a Distancia de Mxico

Licenciatura en Matemticas
Computacin I
Actividad 2: Parmetros para comparacin de
algoritmos
Facilitador: Diana Patricia Moreno Bravo

Alumno: Gregorio Islas Oliver

Tizayuca Hidalgo a 04 de Diciembre del 2014

INTRODUCCIN
La compresin de datos consiste en la reduccin del volumen de informacin
tratable (procesar, transmitir o grabar). En principio, con la compresin se
pretende transportar la misma informacin, pero empleando la menor cantidad de
espacio.
El espacio que ocupa una informacin codificada (datos, seal digital, etc.) sin
compresin es el cociente entre la frecuencia de muestreo y la resolucin. Por
tanto, cuantos ms bits se empleen mayor ser el tamao del archivo. No
obstante, la resolucin viene impuesta por el sistema digital con que se trabaja y
no se puede alterar el nmero de bits a voluntad; por ello, se utiliza la compresin,
para transmitir la misma cantidad de informacin que ocupara una gran resolucin
en un nmero inferior de bits.
La compresin de datos se basa fundamentalmente en buscar repeticiones en
series de datos para despus almacenar solo el dato junto al nmero de veces
que se repite. As, por ejemplo, si en un fichero aparece una secuencia como
"AAAAAA", ocupando 6 bytes se podra almacenar simplemente "6A" que ocupa
solo 2 bytes, en algoritmo RLE.
En realidad, el proceso es mucho ms complejo, ya que raramente se consigue
encontrar patrones de repeticin tan exactos (salvo en algunas imgenes). Se
utilizan algoritmos de compresin:
Tcnicas de compresin de archivos
i.

Run-Length Encoding (RLE)

Es el mtodo ms simple de compresin de imgenes, es til en imgenes cuya


secuencia de caracteres se repiten. Consiste en almacenar el nmero de caracteres que se repiten, seguido del carcter. Por ejemplo, si tenemos una lnea en una
imagen que se inicia con un carcter blanco o vaco, seguido de 10 caracteres * y
finaliza con otro carcter blanco o vaco, la representacin de la lnea se realizar
de la siguiente manera: 1B10*1B. Se observa que se utilizan 7 caracteres para

codificar la lnea, mientras que en la forma original se emplean 12 caracteres. Este


mtodo tambin se utiliza en combina- cin con otros, as el formato JPEG [1] lo
utiliza despus de transformar y cuantificar bloques de imgenes.

ii.

Variable-Length Encoding

En la teora de codificacin el Variable-Length Encoding es un cdigo que se


asigna smbolos de la fuente a un nmero variable de bits.
Los Variable-Length Encoding pueden permitir que las fuentes que se comprimen
y descomprimen con cero error (compresin sin prdida de datos) y aun as ser
ledos de nuevo smbolo a smbolo. Con la estrategia de codificacin del derecho
una fuente independiente e idnticamente distribuidos, se puede comprimir casi
arbitrariamente cerca de su entropa.

Esto est encontraste con los mtodos de codificacin de longitud fija, para lo
cual slo es posible la compresin de datos para grandes bloques de datos, y
ningn tipo de compresin ms all del logaritmo del nmero total de posibilidades
vienen con un finito (aunque quiz arbitrariamente pequeo) probabilidad de
fracaso.
Variable-Length Encoding los pueden anidarse estrictamente en orden decreciente
de generalidad que los cdigos no singulares, cdigos nicamente descifrables y
cdigos de prefijo . Los cdigos prefijo son siempre nicamente descifrable, y
estos a su vez son siempre no singular :

Los cdigos no singulares


Un cdigo es no singular si cada smbolo de origen se asigna a una cadena de bits
no vaca diferente , es decir, el mapeo de smbolos de la fuente de cadenas de bits
es inyectiva.
Por ejemplo, el mapeo M_1 = \ { \ , a \ mapsto 0, b \ mapsto 0, c \ mapsto 1 \, \ } no
es no singular , porque tanto "a" y "b" mapa a la misma cadena de bits " 0 " ;
cualquier extensin de esta asignacin generar una prdida ( sin prdida) de
codificacin . Tal codificacin singular todava puede ser til cuando cierta prdida
de informacin es aceptable (por ejemplo, cuando se utiliza dicho cdigo en audio
o de compresin de vdeo, donde una codificacin con prdida se convierte
equivalente a la cuantizacin fuente ) .
Sin embargo , el mapeo m_2 = \ { \ , a \ mapsto 1 , b \ mapsto 011 , c \ mapsto
01110 , d \ mapsto 1110, e \ mapsto 10011 \, \ } es no singular ; su extensin
generar una codificacin sin prdida , que ser til para la transmisin de datos
en general ( pero esta caracterstica no siempre es necesaria ) . Tenga en cuenta
que no es necesario para el cdigo no singular para ser ms compacta que la
fuente (y en muchas aplicaciones, un cdigo ms grande es til, por ejemplo,
como una forma de detectar y / o recuperarse de codificacin o de transmisin de
errores , o en aplicaciones de seguridad para proteger una fuente de manipulacin
indetectable ) .

nicamente los cdigos descifrables


Un cdigo es nicamente descifrable si su extensin es no singular. El que un
cdigo dado es nicamente descifrable puede decidirse con el algoritmo Sardinas
-Patterson.
El M_3 mapeo = \ { \ , a \ mapsto 0, b \ mapsto 01 , c \ mapsto 011 \, \ } es
nicamente descifrable (esto se puede demostrar examinando el seguimiento
establecido despus de cada cadena de bits de destino en el mapa, ya que cada
cadena de bits se termina tan pronto como vemos un bit 0 que no puede seguir
cualquier cdigo existente para crear un cdigo vlido ya en el mapa, pero sin
ambigedades inicia un nuevo cdigo ) .
Consideremos de nuevo el m_2 cdigo de la seccin anterior. Este cdigo, que se
basa en un ejemplo encontrado en , [ 1 ] no es nicamente descifrable , ya que la
cadena 011101110011 puede interpretarse como la secuencia de palabras de
cdigo 01110 hasta 1110 - 011 , pero tambin como la secuencia de palabras de
cdigo 011 - 1 a 011 - . 10011 Dos posibles decodificaciones de esta cadena
codificada modo se da por cdb y cario. Sin embargo, dicho cdigo es til cuando
el conjunto de todos los posibles smbolos de la fuente es completamente
conocido y finito, o cuando existen restricciones (por ejemplo, una sintaxis formal)
que determinan si los elementos de origen de esta extensin son aceptables.
Estas restricciones permiten la decodificacin del mensaje original mediante la
comprobacin de cul de los posibles smbolos de la fuente asignada a los
mismos smbolos son vlidos bajo esas restricciones.

Los cdigos prefijo


Un cdigo es un cdigo de prefijo si no hay cadena de bits de destino en el mapeo
es un prefijo de la cadena de bits de destino de un smbolo fuente diferente en la
misma asignacin. Esto significa que los smbolos pueden ser decodificados de
forma instantnea despus de recibir la totalidad de su palabra de cdigo. Otros
nombres de uso comn para este concepto son de cdigo libre de prefijo , cdigo
instantneo, o cdigo independiente del contexto .

iii. Construccin del Cdigo Huffman

Los cdigos de Huffman, que representan caracteres por cadenas de bits


de longitud variable, proporcionan alternativas al ASCII y otros cdigos de
longitud fija.

La idea es usar cadenas de bits cortas para representar los caracteres que
se usan con ms frecuencia y cadenas de bits ms largas para los
caracteres de uso menos frecuente.

Huffman desarrollo un algoritmo para construir un cdigo Huffman a partir


de la tabla que da la frecuencia de ocurrencia de los caracteres que se van
a representar para que el cdigo construido represente las cadenas de
caracteres en el mnimo espacio, siempre que las cadenas representadas
tengan frecuencias de caracteres idnticas a las frecuencias de la tabla.

Un cdigo Huffman se define con gran facilidad mediante un rbol con raz.
Para decodificar una cadena de bits, comenzamos en la raz y seguimos
hacia abajo por el rbol hasta que se encuentra el carcter. El bit, 0 o 1,
dice si debemos ir a la derecha o a la izquierda.

0 = derecha

1 = izquierda

El documento deber contener los siguientes elementos: introduccin, desarrollo


(informacin generada por ti), explicacin del funcionamiento de la compresin,
descripcin de las tcnicas de compresin listadas, dos links para conocer ms
algunos de los temas, conclusiones, las fuentes de informacin que consultaste
para el desarrollo de la misma.

Conclusiones
En los ltimos aos se ha dado un aumento tanto de la capacidad de
almacenamiento de datos como en la velocidad de procesamiento en las
computadoras. Junto con esto, la tendencia es la disminucin de costos en
memoria principal y secundaria as como tambin un aumento de velocidad de
estos dispositivos de almacenamiento. Estos acontecimientos ponen en
cuestionamiento la necesidad de compresin de datos. Sin embargo, el auge que
ltimamente han tenido las redes de computadoras, demanda ms prestaciones
que estn por encima de las posibilidades reales. El principal problema al que se
enfrentan las redes de comunicacin es la velocidad de transferencia de datos. El
cambio a mayores velocidades no es tarea fcil.

Links
Notas sobre comprensin de datos
http://www.tamps.cinvestav.mx/~mmorales/documents/Compre.pdf
Comprensin de datos
http://www.google.com.mx/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=11
&ved=0CCwQFjAAOAo&url=http%3A%2F%2Fdelta.cs.cinvestav.mx%2F~ccoello
%2Fconferences%2Fcompresion.pdf.gz&ei=lohpVPTzL4ikyASx_ILgCQ&usg=AFQ
jCNFv-DqLrg7EY3JGxAZY25t_nVkVEQ

También podría gustarte