Está en la página 1de 1

Esquema de compresin para transmisin

segura de datos
Teora de la informacin y mtodos de codificacin
M.C Said Zamora
Participantes:
Constantino Mora Martnez
Vctor Emanuel Ros Martnez
Daniel Alejandro Domnguez Meza

INTRODUCCIN
La compresin de datos es el proceso mediante en el cual la informacin es codificada usando menos cantidad de bits que la representacin original sin codificar. El componente unido a este proceso
es el algoritmo decodificador que reconstruye el mensaje original o una aproximacin a partir de la versin ya comprimida.
La encriptacin es el proceso mediante el cual se codifican los mensajes para hacerlos no- legibles por un intruso web. Por lo tanto, en la mayora de los casos, se utiliza encriptacin despus de la
compresin.
Antes de aplicar algn tipo de algoritmo de compresin se realiza un preprocesamiento en el archivo fuente. La transformacin est diseada para hacer ms fcil la compresin. Generalmente se
utiliza codificacin basada en diccionario para este tipo de transformacin de procesamiento del texto fuente. El diccionario se crea a partir de las palabras ms comunes en el texto. El diccionario debe
ser preparado con anticipacin y debe ser conocido por la fuente y el destinatario. Cada palabra en el diccionario tiene que ser reemplazada por un carcter ASCII. El multidiccionario incrementa la
velocidad de codificacin y decodificacin, porque el acceso a las palabras es muy fcil y rpido. Por otra parte, la codificacin basada en diccionario es dbil y vulnerable a ataques, pero la
encriptacin basada en diccionario proporciona la seguridad requerida.

METODOLOGA

RESULTADOS

Los cuatro pasos principales de esta tcnica son compresin basada en multi--diccionario,
compresin basada en BWT con RLE, algoritmo de encriptacin basado en arreglo reducido y
compresin basada en proceso de codificacin Huffman. Las palabras son extradas de los
archivos de entrada y formadas como entradas de diccionario.

En el estado actual del proyecto hemos obtenido un buen radio de compresin, el tamao de un
mensaje se puede reducir ms de tres veces, dependiendo del mensaje, del nmero de palabras
Seen
tiene
objetivo que el juego sea lo mejor posible dejando atrs los detalles que
repetidas
todocomo
el texto.
causan una mala imagen.
Esperamos que an con el texto cifrado el tamao del mensaje no incremente y que, por el
Uno
los detalles
principales
es el problema que cuando un jugador es atacado puede
contrario,
el de
tamao
sea reducido
an ms.
volver a colocar una nueva coordenada en el lugar ya atacado, esto se puede arreglar
bloqueando
la matrizgrandes
de posicin
una
vez posicionadas
las de
piezas
correspondientes
Con textos
suficientemente
hemos
comprobado
la eficacia
utilizar
en conjunto lospara
cada
nivel.
mtodos
BWT
y RLE despus del diccionario.

Multi-diccionario
Las palabras son extradas de los archivos de entrada y ordenadas como entradas de
diccionario basado en el cdigo ASCII. Este mtodo multidiccionario incrementa la velocidad de
codificacin y decodificacin.Los cdigos ms cortos son asignados a las palabras ms
frecuentemente usadas. Los cdigos ms largos son asignados a las palabras menos usadas.

Algoritmo de codificacin

Transformada de Burrows-Wheeler y Run-Length Encoding


Los archivos de entrada son codificados (en caracteres ASCII) usando la compresin basada
en multi-diccionarios. Este cdigo es la entrada al BWT. La salida de BWT es proporcionada
como entrada al RLE. RLE es un algoritmo de compresin simple en el cual secuencias de
caracteres con el mismo valor consecutivo son guardados como un solo valor con su respectivo
nmero de repeticiones antecediendo al carcter.
Algoritmo de encriptacin y compresin de Begum-Venkataramani
La salida de la codificacin run-length es dada como entrada al algoritmo de encriptacin con
compresin. En los algoritmos de encriptacin generales, el texto plano es convertido en texto
cifrado con el mismo tamao o ms grande. Este algoritmo no slo ha hecho la encriptacin,
tambin ha reducido el tamao del arreglo de entrada por 3 veces.

Otro detalle en el que se tiene que trabajar es que al momento de atacar un nivel y este
Implementacin

se encuentra vaco pero debajo de este (misma posicin distinto nivel) se encuentra
algn otra pieza esta debe de ser afectada por el ataque ya que se supone que el ataque
Texto original:
va dede
una
manera vertical
cayendo hasta
tocar
punto
blanco.
Sistema
Transmisin
de compresin
segura
dealgn
datos:
En este
proyecto se implementa un
algoritmo de compresin con encriptacin y compresin (CEC). Este algoritmo inicialmente
Tambin
tiene para
que checar
la posicin
las piezas
donde los barcos
y aviones y
comprime
lossedatos
reducir losudelongitud.
Losdedatos
ya comprimidos
son encriptados
pueden estar vertical o horizontalmente, los submarinos pueden colocarse de tres
despus nuevamente comprimidos usando un nuevo algoritmo de compresin sin comprometer
maneras posibles (vertical ,horizontal y de una forma inclinada).
la eficiencia de compresin y la seguridad de la informacin.
Se estima que el proyecto pueda estar terminado superando estos detalles.

Codificacin de Huffman
La salida cifrada del algoritmo anterior es pasada al codificador de Huffman para compresin
adicional. El cdigo de Huffman es generado usando un rbol binario.
El cdigo de Huffman est basado en dos observaciones primordiales:
1) Los smbolos que ocurren con ms frecuencia tendrn cdigos ms cortos que los smbolos
que ocurren menos frecuentemente.
2) Los dos smbolos que ocurren menos frecuentemente tendrn la misma longitud.

Algoritmo de decodificacin
Los datos desencriptados son proporcionados al decodificador de RLE y posteriormente al
procedimiento inverso de BWT. De esta forma, el string vuelve al estado original antes de
aplicar RLE y el BWT puede devolver el valor despus de haber aplicado el diccionario para
codificacin la primera vez. El diccionario es obtenido desde el mensaje y se utiliza para
regresar el resto del mensaje a su estado original.

Figura 3. Salida de la ejecucin del programa CEC.


Texto codificado:
6!>!"C!2B)GHF'$!"I*%"8A$+@4(:DE1-(<&,.%?7&/'=$!"93#5!"%#;
! #0
BWT:
05$>$;C6!%!!!!3%='A*".<7F/4-BI$&1,&#E!9@#?""(#('!%+82":DH)G"
RLE:
110151$1>1$1;1C161!1%4!131%1=1'1A1*1"1.1<171F1/141-1B1I1$1&111,1&1#1E1!191@1#1?2"1
(1#1(1'1!1%1+18121"1:1D1H1)1G1"40 1
Tamao del texto original: 423 Bytes
Tamao del texto comprimido: 119 Bytes
Radio de compresin: 3.5546
Tiempo de ejecucin: 0.00287103652954 segundos
El texto original recuperado:
Sistema de Transmisin de compresin segura de datos: En este proyecto se implementa un
algoritmo de compresin con encriptacin y compresin (CEC). Este algoritmo inicialmente
comprime los datos para reducir su longitud. Los datos ya comprimidos son encriptados y
despus nuevamente comprimidos usando un nuevo algoritmo de compresin sin comprometer
la eficiencia de compresin y la seguridad de la informacin.

Figura 1. Diagrama de bloques del algoritmo CEC.

DISCUSIN

CONCLUSIONES

El proyecto an se encuentra en desarrollo, sobre todo en las secciones de cifrado con el


nuevo algoritmo y en la creacin de sus claves para la encriptacin.
Uno de los puntos clave de la implementacin de los algoritmos de compresin y cifrado
utilizados, es el tiempo que toma el cifrado con compresin, y posteriormente, la
descompresin y descifrado. Por ahora, el tiempo se ha mantenido bajo, sin embargo,
esperamos que despus de la implementacin de los algoritmos restantes el tiempo se
incremente considerablemente.
Un escrito de 423 bytes con radio de compresin poco mayor a 3.55 logra un tiempo
aproximado de 0.002871 segundos desde la codificacin por diccionario hasta su
decodificacin al texto original (sin contar el tiempo requerido para su transmisin).

La compresin es parte de nuestra vida cotidiana, es muy til al transmitir datos ya que es
importante hacerlo de la forma ms rpida posible y entre ms pequea sea la longitud de los
datos, ms rpida es la transmisin total, pero es de suma importancia hacerlo sin dejar a un lado
la seguridad.
El algoritmo CEC provee mejores resultados que otros algoritmos debido a que tiene un
rendimiento muy viable y porque alcanza un radio de compresin muy alto tras codificar y
comprimir al mismo tiempo. Sin embargo, el radio de compresin depende del nmero de
palabras en el archivo, tamao del archivo, y las frecuencias y distribucin de las palabras dentro
del archivo.
En este proyecto hemos implementado hasta el momento la compresin y descompresin por
multi-diccionario, seguido por BWT y RLE. El enfoque de este proyecto es asegurar el mensaje
usando la tcnica CEC, pero contemplamos para trabajo futuro, encriptar usando el nuevo
algoritmo de encriptacin Begum--Venkataramani basado en arreglo reducido, seguido por
codificacin Huffman. Adems, como segunda fase del proyecto, trabajar con el rendimiento en
archivos multimedia para mejor diversidad en su implementacin.

BIBLIOGRAFA
[1] Begum, M., & Venkataramani, Y. (n.d.). A New Compression Scheme for Secure Transmission. International Journal of Automation and Computing Int. J. Autom. Comput., 578-586
[2] Hankerson, D., Harris, G., & Johnson, P. (2003). Introduction to Information Theory and Data Compression, Second Edition (Second Edition ed., p. 384). Chapman and Hall/CRC.
[3] K. Sayood. Introduction to Data Compression, 2nd ed., San Francisco: Morgan Kaufmann Publishers, pp. 3961, 149-154, 2000

También podría gustarte