Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Compresin de Archivos
Vctor Saquicela G.
Universidad de Cuenca
Facultad de Ingeniera
Cuenca, Ecuador
Indice
Introduccin
Conceptos de Compresin de Datos Tcnicas de compresin
Introduccin
Una de las preguntas que ms respuestas falsas tiene en la redes es la explicacin de cmo se logran los archivos de compresin, comenzando porque los que pueden responder la pregunta, no logran hacerlo de tal forma que lo comprenda el pblico en general, casi siempre conlleva trminos complicados que presupone ciertos conocimientos tcnicos. La idea fundamental es muy simple, guardar la mayor cantidad de datos posibles en la menor cantidad de espacio posible. Los algoritmos de compresin a lo largo de la historia fueron progresando comprimiendo cada vez mas.
Hoy en da coexisten algoritmos muy simples, otros muy complejos, algunos muy extraos y otros muy ingeniosos.
Sin compresin no tendra sentido poner imgenes, audio o vdeo en Internet, la calidad de las comunicaciones celulares no sera la misma y desde luego la TV digital no sera posible. Podra decirse que la compresin de datos es El arte o la ciencia de representar informacin de una forma compacta [Sayood].
Comprensin de Datos
La idea fundamental de la compresin de datos es reducir el tamao de los archivos de forma tal que estos ocupen menos espacio y que dado el archivo comprimido pueda recuperarse el archivo original .
Para la compresin de datos la fuente es el archivo a comprimir y los mensajes son los caracteres que componen el archivo. La idea de la compresin de datos es, dado un archivo, representar a los caracteres mas probables con menos bits que los caracteres menos probables de forma tal que la longitud promedio del archivo comprimido sea menor a la del archivo original. Se debe distinguir compresin de compactacin, la compactacin se refiere a tcnicas destructivas, es decir que una vez compactado un archivo se pierde informacin y no puede recuperarse el original, la compactacin se puede aplicar a imgenes o sonido para las cuales la perdida de fidelidad puede llegar a justificarse por el nivel de compresin.
En ciencias de la computacin la compresin de datos es la reduccin del volumen de datos tratables para representar una determinada informacin empleando una menor cantidad de espacio. Al acto de compresin de datos se denomina compresin, y al contrario descompresin.
La compresin es un caso particular de la codificacin, cuya caracterstica principal es que el cdigo resultante tiene menor tamao que el original.
Compresin de datos
La compresin de datos se basa fundamentalmente en buscar repeticiones en series de datos para despus almacenar solo el dato junto al nmero de veces que se repite. As, por ejemplo, si en un fichero aparece una secuencia como "AAAAAA", ocupando 6 bytes se podra almacenar simplemente "6A" que ocupa solo 2 bytes. Proceso que permite representar la informacin de una fuente de datos en formato digital, usando el mnimo nmero posible de bits y perdiendo la mnima cantidad de informacin aceptable Tipos de fuentes de datos: Texto, fotografa, audio, video, otras seales (datos de sensores, ) Importancia de la compresin: Muchas fuentes de datos, una vez digitalizadas, requieren: Gran cantidad de bits en comparacin con la capacidad de almacenamiento disponible Gran velocidad de transmisin en comparacin con la mxima velocidad admisible por el Sistema de Comunicacin Digital a travs del que deben enviarse Tasa de bits (bitrate): Nmero de bits por unidad de tiempo producidos por una fuente de datos (bits/s, o tambin bps). Por extensin, nmero de bits requeridos para almacenar un archivo (bits/imagen, por ejemplo)
Tecnicas de compresin
Cualquier algoritmo o tcnica de compresin tiene dos partes: Un algoritmo de compresin que toma una entrada X y genera una representacin Xc que necesita menos bits. Un algoritmo de reconstruccin que trabaja en la representacin comprimida Xc y genera la reconstruccin Y.
Compresin de binarios/ejecutables
Compresin de imgenes mdicas
Medidas de calidad
Cmo evaluamos la calidad de un algoritmo de compresin?: 1. Complejidad del algoritmo 2. Necesidades de memoria 3. Tiempo de ejecucin en una determinada plataforma
4. Cantidad de compresin
5. Cuanto se parece la reconstruccin a los datos originales
Medidas de calidad
Medidas de calidad
Codificacin Hufmman
Referencias
http://es.wikipedia.org/ K. Sayood, Introduction to Data Compression, Morgan and Kaufmann, 2005. http://www.youtube.com/watch?v=hWCjkZ04NWE http://www.youtube.com/watch?v=CIvQ-pt_uYs&feature=related
http://www.slideshare.net/mejiaff/cdigo-huffman
http://www.youtube.com/watch?v=8Gf8wutvS1w