Es un estndar de codificacin multilinge creado con el nico propsito de evitar
ambigedades, UNICODE marco gran diferencia pues su objetivo principal es lograr asignar un numero diferente a cada carcter posible ya sea una letra en espaol, japons, o cualquier otro idioma incluyendo aquellos que se consideran extintos. Por qu asignar un nmero diferente a cada carcter? A diferencia de los antiguos codificadores, UNICODE se dio cuenta que lo que en computacin realmente importa es la precisin ya que todo lo que en ellas se almacena terminan siendo nmeros. La compatibilidad es una viga de gran tamao en la estructura de UNICODE, si se busca un verdadero estndar no importa la plataforma y menos los paquetes que en esta se ocupen, mucho menos si es China o Per, es por esto que durante su camino, UNICODE ha buscado aliarse con los gigantes y los pequeos de la computacin, Microsoft, Apple, Adobe, IBM, estos por mencionar algunos son claros ejemplos de que UNICODE busca estar en todas las plataformas. UNICODE es distribuido de manera gratuita, tanto va web como de forma impresa, en cada versin el numero de caracteres que en el se encuentran plenamente identificados y representados aumenta a tal grado que en las versiones recientes encontramos una cifra que se extiende a mas de 100,000 caracteres diferentes y obviamente representados todos de manera distinta. Solo toma el contenido de valor en sus criterios de asignacin, es decir que no se preocupa por el tipo de letra, el tamao, o si es negrita, solo se enfoca en saber que representara, en cambio si presta atencin al hecho de los caracteres compuesto como acentos o la misma . Para su listado se utiliza una representacin hexadecimal antecedida por el prefijo u de esta forma la parte hexadecimal es el identificador nico que en caso de ser menor a cuatro dgitos, estos sern completados por ceros hasta tener 4 dgitos, en caso de que su representacin sea mayor a ese nmero no ser necesario agregar dichos ceros. Cuenta con una base de datos UCD (unicode character database), en la que adems de su representacin encontramos el idioma al que pertenece, clasificacin y otros campos que permiten un ordenamiento adecuado. Como es de esperarse UNICODE tambin sabe que no todas las computadoras tienen la misma arquitectura, es por eso que cuenta con diferentes formas de codificacin las cuales son las siguientes -
UTF-8 para equipos que utilizaran 8 bits para la representacin de un carcter
UTF-16 para el caso de 16 bits UTF-32 respectivamente de 32 bits