Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contenido
1. 2. 3. Manipulacin de Texto y cadenas grandes ........................................................................................................... 2 Uso de expresiones regulares ................................................................................................................................ 3 Codificacin de texto ............................................................................................................................................. 5
Este mdulo describe las principales caractersticas del espacio de nombres System.Text que el. NET Framework proporciona. En l se explica cmo almacenar y manipular cadenas, cmo y cundo aplicar las expresiones regulares, y cmo personalizar las codificaciones para obtener los resultados correctos al procesar el texto. Ejemplo: Validaciones de cadena.
Puntos estratgicos del Curso: Explicar el propsito y el uso de la clase StringBuilder. Describa el propsito de crear y expresiones regulares mediante las clases del espacio de nombres System.Text.RegularExpressions. Describe la codificacin del texto y la forma de codificar y decodificar el texto mediante el uso de las clases de codificacin.
.Append= Anexa al final una copia de la instancia especificada. .AppendFormat= Anexa a la instancia una cadena con formato. Puede ser uno varios. .AppendFormat(Cadena de formato compuesto,Informacion de formato cultural,Cadena de formato compuesta,Cadena del formato computo) Cadena final: "La primera parte de la cadena. Segunda y tercera parte de la cadena"
de
la
referencia
La formacin de las expresiones regulares Tabla ms extensa Descripcin \ Marca de carcter especial ^ Comienzo de una lnea $ Final de una lnea . Cualquier carcter (menos salto de lnea) | Indica opciones () Agrupar caracteres [] Conjunto de caracteres opcionales
Resultado Busca la palabra $ftp Lneas que comienzan por Lneas que terminan por s Palabras de una sla letra Busca Local, local, focal Busca vocal Vale escriba, escribo, escribe
La tabla que sigue describe los modificadores que pueden usarse con los caracteres que forman el patrn. Descripcin Ejemplo Resultado * Repetir 0 o ms veces /l*234/ Valen 234, 1234, 11234... + Repetir 1 o ms veces /a+mar/ Valen amar, aamar, aaamar... ? 1 o 0 veces /a?mar/ Valen amar, mar. {n} Exactamente n veces /p{2}sado/ Vale ppsado {n,} Al menos n veces /(m){2}ala/ Vale mmala, mmmala.... {m,n} entre m y n veces /tal{1,3}a/ Vale tala, talla, tallla Los siguientes son caracteres especiales o meta caracteres para indicar caracteres de texto no imprimibles, como puedan ser el fin de lnea o un tabulador, o grupos predefinidos de caracteres (alfabticos, numricos, etc...) Significado Principio o final de palabra Frontera entre no-palabras Un dgito Alfabtico (no dgito) Carcter nulo Caracter ASCII 9 (tabulador) Salto de pgina Salto de lnea Cualquier alfanumrico, Opuesto a \w Carcter tipo espacio (como tab) Opuesto a \s Carcter de control X Carcter octal NN El hexadecimal hh Ejemplos /\bver\b/ /\Bver\B/ /[A-Z]\d/ /[A-Z]\D/ Resultado Encuentra ver en "ver de", pero no en "verde" Empareja ver con "Valverde" pero no con "verde" No falla en "A4" Fallara en "A4"
Encuentra frase en "frase.", pero no el . (punto). Hallara slo el punto (.) Encuentra Si en "Digo Si ", pero no en "Digo Sientate" El tabulador Encuentra la A (ASCII Hex41) en "letra A"
\c9 /\x41/
Coincidencia de patrones mediante expresiones regulares Para que coincida con los patrones mediante el uso de mtodos de instancia de la clase Regex: Crear un objeto Regex, pasando la cadena del modelo como un parmetro a la llamada del constructor Llame a los mtodos IsMatch, Match, or Matches, del objeto Regex, pasando la entrada de la cadena como un parmetro
Extraccin de datos mediante el uso de expresiones regulares Crear una expresin regular que incluyan grupos que coincidan. Crear una instancia del objeto Regex Crear una instancia del objeto coincidente mediante el mtodo instance.Match Recuperar datos mediante el acceso a los miembros de la coleccin Match.Groups
Para que coincida con los patrones de uso de los mtodos estticos de la clase Regex: Como el anterior, excepto: Ignorar el paso 2 Llame al mtodo Regex.Match en el paso 3
3. Codificacin de texto
Qu es la codificacin de texto? Codificacin de texto es el conjunto de caracteres usados para representar datos de cadena: ASCII sigue siendo la base para todos los tipos de codificacin existentes ASCII representa personajes mediante el uso de 7-bits, bytes (128 caracteres) Muchos fabricantes utilizan los valores restantes en un byte (128-255) Los fabricantes diferentes utilizan diferentes formatos Diferentes formatos de conducir a la incompatibilidad La incompatibilidad conduce a la definicin de las pginas estndar cdigo ANSI Unicode tambin cada vez ms frecuente: ~ 100.000 caracteres, nica pgina de cdigos
Uso de la clase Encoding La clase Encoding proporciona varios mtodos tiles para: Devolver un tipo de codificacin a utilizar para codificar el texto Convertir una cadena de entrada en una serie de bytes de una codificacin especfica Proveer soporte para un rango de codificaciones ANSI y ISO
Utilice el mtodo Encoding.GetBytes para convertir cadenas Encoding e = Encoding.GetEncoding("Korean") Byte[] EncodedString; EncodedString = e.GetBytes("Hello, World!"); Encoding = Representa una codificacin de caracteres. .GetEncoding = Devuelve una codificacion asociada al nombre de la pagina de nombres asociada. Byte[] = Representa un entero de 8 bits sin signo. e.GetBytes = Cuando se reemplaza una clase derivada, codifica los caracteres de una clase string a una secuencia de bytes
Especificar el tipo de codificacin a usar Para especificar el tipo de codificacin a utilizar: Proporcionar un valor para el parmetro de codificacin al crear objetos StreamReader y StreamWriter No se puede cambiar la codificacin de un objeto StreamReader StreamWriter o despus de su creacin Si no est seguro que tipo de codificacin a utilizar, no proporcionan un valor del parmetro de codificacin;. NET de forma predeterminada UTF8Encoding.