Está en la página 1de 1

Unicode

Es un estndar de codificacin multilinge creado con el nico propsito de evitar


ambigedades, UNICODE marco gran diferencia pues su objetivo principal es lograr
asignar un numero diferente a cada carcter posible ya sea una letra en espaol, japons,
o cualquier otro idioma incluyendo aquellos que se consideran extintos. Por qu asignar
un nmero diferente a cada carcter? A diferencia de los antiguos codificadores,
UNICODE se dio cuenta que lo que en computacin realmente importa es la precisin ya
que todo lo que en ellas se almacena terminan siendo nmeros.
La compatibilidad es una viga de gran tamao en la estructura de UNICODE, si se
busca un verdadero estndar no importa la plataforma y menos los paquetes que en esta
se ocupen, mucho menos si es China o Per, es por esto que durante su camino,
UNICODE ha buscado aliarse con los gigantes y los pequeos de la computacin,
Microsoft, Apple, Adobe, IBM, estos por mencionar algunos son claros ejemplos de que
UNICODE busca estar en todas las plataformas.
UNICODE es distribuido de manera gratuita, tanto va web como de forma impresa, en
cada versin el numero de caracteres que en el se encuentran plenamente identificados y
representados aumenta a tal grado que en las versiones recientes encontramos una cifra
que se extiende a mas de 100,000 caracteres diferentes y obviamente representados
todos de manera distinta.
Solo toma el contenido de valor en sus criterios de asignacin, es decir que no se
preocupa por el tipo de letra, el tamao, o si es negrita, solo se enfoca en saber que
representara, en cambio si presta atencin al hecho de los caracteres compuesto como
acentos o la misma .
Para su listado se utiliza una representacin hexadecimal antecedida por el prefijo u
de esta forma la parte hexadecimal es el identificador nico que en caso de ser menor a
cuatro dgitos, estos sern completados por ceros hasta tener 4 dgitos, en caso de que
su representacin sea mayor a ese nmero no ser necesario agregar dichos ceros.
Cuenta con una base de datos UCD (unicode character database), en la que adems de
su representacin encontramos el idioma al que pertenece, clasificacin y otros campos que
permiten un ordenamiento adecuado.
Como es de esperarse UNICODE tambin sabe que no todas las computadoras tienen la
misma arquitectura, es por eso que cuenta con diferentes formas de codificacin las cuales
son las siguientes
-

UTF-8 para equipos que utilizaran 8 bits para la representacin de un carcter


UTF-16 para el caso de 16 bits
UTF-32 respectivamente de 32 bits

También podría gustarte