Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Licenciatura en Matemticas
Computacin I
Actividad 2: Parmetros para comparacin de
algoritmos
Facilitador: Diana Patricia Moreno Bravo
INTRODUCCIN
La compresin de datos consiste en la reduccin del volumen de informacin
tratable (procesar, transmitir o grabar). En principio, con la compresin se
pretende transportar la misma informacin, pero empleando la menor cantidad de
espacio.
El espacio que ocupa una informacin codificada (datos, seal digital, etc.) sin
compresin es el cociente entre la frecuencia de muestreo y la resolucin. Por
tanto, cuantos ms bits se empleen mayor ser el tamao del archivo. No
obstante, la resolucin viene impuesta por el sistema digital con que se trabaja y
no se puede alterar el nmero de bits a voluntad; por ello, se utiliza la compresin,
para transmitir la misma cantidad de informacin que ocupara una gran resolucin
en un nmero inferior de bits.
La compresin de datos se basa fundamentalmente en buscar repeticiones en
series de datos para despus almacenar solo el dato junto al nmero de veces
que se repite. As, por ejemplo, si en un fichero aparece una secuencia como
"AAAAAA", ocupando 6 bytes se podra almacenar simplemente "6A" que ocupa
solo 2 bytes, en algoritmo RLE.
En realidad, el proceso es mucho ms complejo, ya que raramente se consigue
encontrar patrones de repeticin tan exactos (salvo en algunas imgenes). Se
utilizan algoritmos de compresin:
Tcnicas de compresin de archivos
i.
ii.
Variable-Length Encoding
Esto est encontraste con los mtodos de codificacin de longitud fija, para lo
cual slo es posible la compresin de datos para grandes bloques de datos, y
ningn tipo de compresin ms all del logaritmo del nmero total de posibilidades
vienen con un finito (aunque quiz arbitrariamente pequeo) probabilidad de
fracaso.
Variable-Length Encoding los pueden anidarse estrictamente en orden decreciente
de generalidad que los cdigos no singulares, cdigos nicamente descifrables y
cdigos de prefijo . Los cdigos prefijo son siempre nicamente descifrable, y
estos a su vez son siempre no singular :
La idea es usar cadenas de bits cortas para representar los caracteres que
se usan con ms frecuencia y cadenas de bits ms largas para los
caracteres de uso menos frecuente.
Un cdigo Huffman se define con gran facilidad mediante un rbol con raz.
Para decodificar una cadena de bits, comenzamos en la raz y seguimos
hacia abajo por el rbol hasta que se encuentra el carcter. El bit, 0 o 1,
dice si debemos ir a la derecha o a la izquierda.
0 = derecha
1 = izquierda
Conclusiones
En los ltimos aos se ha dado un aumento tanto de la capacidad de
almacenamiento de datos como en la velocidad de procesamiento en las
computadoras. Junto con esto, la tendencia es la disminucin de costos en
memoria principal y secundaria as como tambin un aumento de velocidad de
estos dispositivos de almacenamiento. Estos acontecimientos ponen en
cuestionamiento la necesidad de compresin de datos. Sin embargo, el auge que
ltimamente han tenido las redes de computadoras, demanda ms prestaciones
que estn por encima de las posibilidades reales. El principal problema al que se
enfrentan las redes de comunicacin es la velocidad de transferencia de datos. El
cambio a mayores velocidades no es tarea fcil.
Links
Notas sobre comprensin de datos
http://www.tamps.cinvestav.mx/~mmorales/documents/Compre.pdf
Comprensin de datos
http://www.google.com.mx/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=11
&ved=0CCwQFjAAOAo&url=http%3A%2F%2Fdelta.cs.cinvestav.mx%2F~ccoello
%2Fconferences%2Fcompresion.pdf.gz&ei=lohpVPTzL4ikyASx_ILgCQ&usg=AFQ
jCNFv-DqLrg7EY3JGxAZY25t_nVkVEQ