Está en la página 1de 18

Sistemas de codificación

Contenidos
• Sistemas de representación alfanumérica
• El código ASCII
• ASCII extendido
• Otros sistemas de codificación
• El código UNICODE
Sistemas de representación alfanumérica
Representación alfanumérica
• Con los códigos estudiados hasta el momento, sólo es posible
representar información numérica.

• En muchos sistemas digitales, es necesario representar


información alfanumérica y además algunos signos especiales, lo
que ha dado lugar a la existencia de códigos alfanuméricos.

• De entre los diversos sistemas de representación alfanumérica


existentes, destacamos:
▪ ASCII
▪ EBCDIC
▪ UNICODE
El código ASCII
El código ASCII
• El código ASCII fue uno de los primeros códigos de caracteres que
se construyó.
• Inicialmente sólo usaba 7 bits para crear cada carácter.
▪ Por tanto, sólo se podían representar 128 caracteres distintos
▪ Desde el 0000000 hasta el 1111111
Tabla ASCII
Algunas equivalencias de representación en ASCII
65 01000001 A 78 01001110 N
66 01000010 B 79 01001111 O
67 01000011 C 80 01010000 P
68 01000100 D 81 01010001 Q
69 01000101 E 82 01010010 R
70 01000110 F 83 01010011 S
71 01000111 G 84 01010100 T
72 01001000 H 85 01010101 U
73 01001001 I 86 01010110 V
74 01001010 J 87 01010111 W
75 01001011 K 88 01011000 X
76 01001100 L 89 01011001 Y
77 01001101 M 90 01011010 Z
ASCII extendido
ASCII extendido
• Para subsanar la ausencia de caracteres del código ASCII (las
letras ñ y Ñ, las vocales acentuadas, …) , se crearon sistemas de
de 8 bits, capaces de ampliar la representación:
• ASCII extendido
• EBCDIC
• ISO/IEC8859-1
Tabla de codificación ASCII extendido
DEC BIN Char DEC BIN Char DEC BIN Char DEC BIN Char
128 10000000 € 160 10100000 192 11000000 À 224 11100000 à
129 10000001 161 10100001 ¡ 193 11000001 Á 225 11100001 á
130 10000010 ‚ 162 10100010 ¢ 194 11000010 Â 226 11100010 â
131 10000011 ƒ 163 10100011 £ 195 11000011 Ã 227 11100011 ã
132 10000100 „ 164 10100100 ¤ 196 11000100 Ä 228 11100100 ä
133 10000101 … 165 10100101 ¥ 197 11000101 Å 229 11100101 å
134 10000110 † 166 10100110 ¦ 198 11000110 Æ 230 11100110 æ
135 10000111 ‡ 167 10100111 § 199 11000111 Ç 231 11100111 ç
136 10001000 ˆ 168 10101000 ¨ 200 11001000 È 232 11101000 è
137 10001001 ‰ 169 10101001 © 201 11001001 É 233 11101001 é
138 10001010 Š 170 10101010 ª 202 11001010 Ê 234 11101010 ê
139 10001011 ‹ 171 10101011 « 203 11001011 Ë 235 11101011 ë
140 10001100 Œ 172 10101100 ¬ 204 11001100 Ì 236 11101100 ì
141 10001101 173 10101101 205 11001101 Í 237 11101101 í
142 10001110 Ž 174 10101110 ® 206 11001110 Î 238 11101110 î
143 10001111 175 10101111 ¯ 207 11001111 Ï 239 11101111 ï
144 10010000 176 10110000 ° 208 11010000 Ð 240 11110000 ð
145 10010001 ‘ 177 10110001 ± 209 11010001 Ñ 241 11110001 ñ
146 10010010 ’ 178 10110010 ² 210 11010010 Ò 242 11110010 ò
147 10010011 “ 179 10110011 ³ 211 11010011 Ó 243 11110011 ó
148 10010100 ” 180 10110100 ´ 212 11010100 Ô 244 11110100 ô
149 10010101 • 181 10110101 µ 213 11010101 Õ 245 11110101 õ
150 10010110 – 182 10110110 ¶ 214 11010110 Ö 246 11110110 ö
151 10010111 — 183 10110111 · 215 11010111 × 247 11110111 ÷
152 10011000 ˜ 184 10111000 ¸ 216 11011000 Ø 248 11111000 ø
153 10011001 ™ 185 10111001 ¹ 217 11011001 Ù 249 11111001 ù
154 10011010 š 186 10111010 º 218 11011010 Ú 250 11111010 ú
155 10011011 › 187 10111011 » 219 11011011 Û 251 11111011 û
156 10011100 œ 188 10111100 ¼ 220 11011100 Ü 252 11111100 ü
157 10011101 189 10111101 ½ 221 11011101 Ý 253 11111101 ý
158 10011110 ž 190 10111110 ¾ 222 11011110 Þ 254 11111110 þ
159 10011111 Ÿ 191 10111111 ¿ 223 11011111 ß 255 11111111 ÿ
Representación interna de la información
• CR: Retorno de carro. Vuelta a la columna 1
• LF: Salto de línea. Avance a la siguiente línea.

• Windows: Termina las líneas con CR+LF


• Unix: Emplea LF únicamente
• Mac: Ahora usa LF, antes usaba CR
Otros sistemas de codificación
Otros sistemas de codificación
• ¿Qué otros sistemas de representación de la información se
emplean hoy en día?

▪ UTF-8
▪ UTF-16
▪ Windows-1252
▪ ISO 8859-1 a 16
▪ UNICODE
Sistema UNICODE
Sistema de representación UNICODE
• Es un estándar de codificación mejorado que inicialmente
disponía de 2^16 = 65.536 caracteres.
• Ampliaba así la cantidad de símbolos a representar de todos los
países.
Tablas UTF

Carácter Codificación Bits


A UTF-8 01000001

A UTF-16 00000000 01000001

A UTF-32 00000000 00000000 00000000 01000001


Alcance de UNICODE
• ¿Cuántos caracteres puede representar Unicode?
• 136.755 caracteres en la actualidad, aunque define un espacio
de 0x10FFFF códigos
• ¿En decimal?
• 1.114.112 caracteres distintos

También podría gustarte