Está en la página 1de 35

INDICE

INTRODUCCION .......................................................................................... 3 OBJETIVOS .................................................................................................. 4 OBEJETIVO GENERAL ........................................................................... 4 OBJETIVOS ESPECIFICOS .................................................................... 4 MARCO TEORICO ....................................................................................... 5 ANTECEDENTES HISTORICOS DE LA TECNOLOGIA PARA LOS DISCAPACITADOS (SORDOMUDO) ..................................................... 5 EDUCACION PARA SORDOMUDOS .................................................... 8 INTELIGENCIA ARTIFICIAL .................................................................... 9 SINTETIZADORES DE VOZ .................................................................. 15 PROCESAMIENTO DE LENGUAJE NATURAL ................................. 22 ANTECEDENTES ...................................................................................... 29 PLANTEAMIENTO DEL PROBLEMA ...................................................... 30 JUSTIFICACION......................................................................................... 31 METODOLOGIA ......................................................................................... 32 RESULTADOS ESPERADOS .................................................................. 33 PROYECTOS FUTUROS .......................................................................... 34 BIBLIOGRAFIA ........................................................................................... 35

INTRODUCCION
En nuestra vida actual nos es factible encontrarnos con personas con capacidades diferentes a las nuestras, personas que a pesar de la adversidad y las problemticas a las que se enfrentan luchan por salir adelante, y nos demuestran que para ellos no existen limitaciones, ni obstculos, porque no hay poder ms grande que el de la mente o la idea. La mayora de las personas con discapacidades no estudian por y estas personas son discriminadas, existen varios inventos o avances tecnolgicos pero se sabe que estos inventos son muy caros y puesto que solo personas con los suficientes recursos los pueden tener, nos hemos enfocando en disear un proyecto en el cual las personas sordomuda pueda seguir estudiando por medio de este proyecto enfocndonos especialmente a estas personas. En el contenido podremos encontrar algunos avances tecnolgicos que se han realizado para personas con capacidades diferente, con el fin de apoyar con la educacin de las personas, se dice que estas personas que padecen de este problema desarrollan los otros sentidos mejor que los de una persona normal y eso los hace personas especiales.

OBJETIVOS
OBEJETIVO GENERAL
Realizar un prototipo para apoyar y facilitar la educacin de las personas con capacidades diferentes.

OBJETIVOS ESPECIFICOS

Realizar una investigacin basada en proyectos similares. Hacer un anlisis para verificar la factibilidad del proyecto. Realizar una investigacin para verificar si los prototipos similares pueden modificarse crear el software capaz de realizar las acciones determinadas

MARCO TEORICO
ANTECEDENTES HISTORICOS DE LA TECNOLOGIA PARA LOS DISCAPACITADOS (SORDOMUDO)
La audicin es el medio por el cual el ser humano adquiere el lenguaje verbal, ya que desde nios tienen el contacto de audicin con personas que le rodean y aunque aun no compre el significado de las palabras, este comienza a balbucear algunas palabras sin sentido y segn su crecimiento comienza a entender lo que escucha y el significado de lo que este dice. Este conocimiento lo empieza a adquirir desde muy pequeo con los padres, familiares, escuela, y es aqu en donde adquiere el mejor desarrollo de conocimiento verbal y auditivo, pero, solo pocos nos preguntamos Qu pasa con aquellos nios que no pueden or bien? Este es un problema muy difcil de llevar ya que los padres deben de tener el nimo de ayudar a su hijo a desarrollarse bien en al ambiente que le rodea, aunque la mayora de estos nios reciben un tipo de terapia especial para desarrollarse bien en los sentidos que ha este le funcionan correctamente, ya que se dice que los sentido que funcionan se desarrollan aun mas, ha este tipo de problema segn los investigadores se les conoce como hipoacusia. Segn investigacin se dice que en Mxico nacen 2400 nios con sordera al ao y slo el 10% de estos recibe educacin. Se estima que cada ao se suman en Mxico, a las ms de 10 millones de personas con alguna discapacidad, alrededor de 2,400 por Sordera Congnita.

Cientficos en Estados Unidos presentaron lo que dicen es la ltima generacin de implantes auditivos. Se trata de un pequesimo electrodo que se implanta directamente en el nervio auditivo. Se espera que los
Figura 1

nuevos implantes ayuden a la gente profundamente sorda

a or con una amplia gama de frecuencias sonoras. Se dice que algunas de las posibilidades de los implantes cocleares, que se usan desde mediados de los '80, se colocan cerca del nervio que transporta las seales sonoras al cerebro. Sin embargo, estos aparatos estn separados del nervio auditivo por una pared sea, lo cual a menudo dificulta al usuario escuchar sonidos de tono bajo. X Woofer, un collar vibrador para ''sentir'' la pelcula Se trata de un revolucionario sistema de audio/vibracin que se coloca alrededor del cuello y permite captar las sensaciones de la pelcula, la msica o el video juego, multiplicando las sensaciones. Una persona lo prob
Figura 2

colgando en su cuello y lo enchuf con TV, se puso a ver pelcula y se quedo impresionada. El collar vibraba por todo

el cuerpo en intensidad y tiempo que el audio de la pelcula. No poda creer lo que estaba viendo, o mejor dicho sintiendo.

El software "Speaker Hands" de Brainstorm SW es un software desarrollado por un grupo de alumnos de 4to ao de la UTFSM. Una de las principales caractersticas, es que
Figura 3

el usuario podr elegir el personaje que ms le acomode

para reproducir el relato, como tambin una interfaz muy intuitiva, para que esta no sea una dificultad. Adems SH tendr la opcin de ver con subtitulo lo que se
6

est relatando, como tambin tendr la opcin de ver solo el texto y mediante un click en las y ver su significado en las palabras ms difciles.

Interfaz muy intuitiva, para que esta no sea una dificultad. Adems SH tendr la opcin de ver con subtitulo lo que se est relatando, como tambin tendr la opcin de ver solo el texto y mediante un click en las y ver su significado en las palabras ms difciles. Intrprete de lengua de seas virtual Una organizacin britnica dedicada a la ayuda a las personas sordas acaba de lanzar un intrprete de la lengua de seas virtual. El software ha sido desarrollado por la Universidad de East Anglia y la productora britnica de software de animacin
Figura 4

para televisin Televirtual, y consiste en un personaje de animacin, cuyo nombre es Guido, que traduce a la lengua

de signos britnica se dice que el software aun esta en prueba. Inventan un aparato revolucionario contra la sordera Meng Shengde, un maestro retirado de 57 aos de la ciudad china de Xian, ha inventado un aparato con el que las personas con problemas auditivos pueden "or" a travs de sus dientes, ya que la mandbula transmite las vibraciones del sonido a los nervios del odo. Consiste en una especie de boquilla de cinco centmetros que el paciente muerde con los dientes y conectada por cables, como si fuera un auricular, a una televisin, una radio, un telfono mvil o cualquier otro aparato emisor de sonido. Gracias a este aparato, que ha sido probado con xito por un centenar de personas con problemas de audicin, los dientes captan las vibraciones de esos aparatos y son capaces de or, asegura el inventor.

EDUCACION PARA SORDOMUDOS


Educar a un nio no es hacerle aprender algo que no saba; sino hacer de l alguien que no exista. (John Ruskin)

Educacin Especial, puesto que parecieran que conforman un espacio sin historia, ni razn de ser y existir. Es por ello que, considero trascendente realizar una aproximacin a los hechos que muestran la evolucin de los momentos claves de la educacin de los sordos. Durante la segunda mitad del siglo XIX el Ex presidente de Mxico Don Benito Jurez Garca, fue la primera persona que atendi el llamado del Maestro sordo francs Eduardo Huet (1822-1882), sobre la urgencia de reconocer y aceptar el lenguaje natural de los sordos, con sus smbolos y gestos, utilizados como medios de comunicacin, tan vlidos como el lenguaje oral de la comunidad oyente. Y fue a principios de 1867 que se promulg la Ley orgnica de Instruccin Pblica, -que pretenda reorganizar la educacin a nivel nacional-, aunque bien esa disposicin tuvo vigencia en el Distrito y los territorios que dependan directamente del ejecutivo federal, no fue sino hasta el 28 de noviembre del mismo ao cuando Benito Jurez, publica un decreto que determina fundar la Escuela Nacional de Sordomudos, que funcionara tambin como escuela normal de profesores, ubicada en las instalaciones del ex convento Corpus Cristi.

Con la fundacin de la Escuela Nacional se da inicio formal al esfuerzo educativo para los sordos, pero Cuntos sordos se beneficiaron de l?, segn el decreto juarista, la matrcula inicial fue de 24 alumnos, mientras tanto los dems sordos vivan en el abandono y la desgracia, tal como sucede hasta nuestros tiempos. Sin embargo, dicha controversia no culmina ah, basta mencionar que en Mxico existe un enfoque diferente que es adoptado con posturas del bilingismo y oralistas, es por esto que la historia de la educacin del sordo, ha sido de exclusin ya que al adoptar el modelo oralistas, los privamos de lo ms valioso, que es el uso de su lengua y capacidad para comunicarse, desarrollar su pensamiento y capacidad intelectual.

Ya que la educacin del sordo, es un problema social y la simple idea de que conforman una minora con caractersticas lingsticas, culturales y cognoscitivas particulares, debera conducir a un anlisis diferente, acerca de los problemas especficos de la educacin de los sordos. Por tanto considero fundamental el hecho de profundizar la vida y cultura de dicha comunidad, ya que los indicios del pasado nos invitan a reflexiones crticas para comprender las condiciones del presente y proyectar las necesidades del maana.

INTELIGENCIA ARTIFICIAL
La inteligencia artificial es considerada una rama de la computacin y relaciona un fenmeno natural con una analoga artificial a travs de programas de computador. La inteligencia artificial puede ser tomada como ciencia si se hacia

la elaboracin de programas basados en comparaciones con la eficiencia del hombre, contribuyendo a un mayor entendimiento del conocimiento humano. Si por otro lado es tomada como ingeniera, basada en una relacin deseable de entrada-salida para sintetizar un programa de computador. "El resultado es un programa de alta eficiencia que funciona como una poderosa herramienta para quien la utiliza." A travs de la inteligencia artificial se han desarrollado los sistemas expertos que pueden limitar la capacidad mental del hombre y relacionan reglas de sintaxis del lenguaje hablado y escrito sobre la base de la experiencia, para luego hacer juicios acerca de un problema, cuya solucin se logra con mejores juicios y ms rpidamente que el ser humano. En la medicina tiene gran utilidad al acertar el 85 % de los casos de diagnstico. La Inteligencia Artificial trata de conseguir que los ordenadores simulen en cierta manera la inteligencia humana. Se acude a sus tcnicas cuando es necesario incorporar en un sistema informtico, conocimiento o caractersticas propias del ser humano.

HISTORIA Los esfuerzos por reproducir algunas habilidades mentales humanas en mquinas y androides se remontan muy atrs en la historia. El mito del coloso de Rodas entre los griegos, las estatuas "parlantes" del medioevo, el androide de Von Kempelen que jug al ajedrez con Napolen, y el "motor analtico" de Charles Babbage que calculaba logaritmos, son slo algunos de los ejemplos de este antiguo inters. Igualmente, la concepcin de la inteligencia humana como un mecanismo no es reciente ni ha estado disociada de la psicologa: Descartes, Hobbes, Leibniz, y el mismo Hume se refirieron a la mente humana como una forma de mecanismo. Durante el siglo XIX y la primera mitad del XX, las analogas biolgicas y fenomenolgicas desplazaron a la nocin de mecanismo en el estudio de la mente humana. Sin embargo, a partir de la segunda mitad de nuestro siglo, la nocin de mecanismo renov su poder heurstico con la formalizacin de la nocin de "computacin". Como algunas mquinas, especialmente las calculadoras, se disearon para evitar el tener que pensar y para hacer el pensamiento ms rpido y exacto, fue inevitable que desde sus orgenes las calculadoras, y ms adelante las computadoras, se relacionaran con la inteligencia y el pensamiento enfatizando sus similitudes. La IA fue introducida a la comunidad cientfica en 1950 por el ingls Alan Turing en su artculo "Maquinaria Computacional e Inteligencia." A pesar de que la investigacin sobre el diseo y las capacidades de las computadoras comenzaron algn tiempo antes, fue hasta que apareci el artculo de Turing que la idea de una mquina inteligente cautiv la atencin de los cientficos. La pregunta bsica que Turing trat de responder afirmativamente en su artculo era: pueden las mquinas pensar? Los argumentos de Turing en favor de la posibilidad de inteligencia en las mquinas, iniciaron un intenso debate que marc
10

claramente la primera etapa de interaccin entre la IA y la psicologa. Los debates en aquella poca se centraron en el anlisis de la serie de problemas implicados en la aplicacin de trminos mentalistas a las computadoras. La intencin de Turing no era la de usar estos trminos como analogas sino la de eliminar la distincin entre inteligencia natural e inteligencia artificial. Dos de las contribuciones ms importantes de Turing a la IA fueron el diseo de la primera computadora capaz de jugar ajedrez y, ms importante que esto, el establecimiento de la naturaleza simblica de la computacin. El trabajo de Turing, quien falleci prematuramente, fue continuado en los Estados Unidos por John Von Neumann durante la dcada de los cincuentas. Su contribucin central fue la idea de que las computadoras deberan disearse tomando como modelo al cerebro humano. Von Neumann fue el primero en "antropomorfizar" el lenguaje y la concepcin de la computacin al hablar de la "memoria", los "sensores", etc., de las computadoras. Construy una serie de mquinas utilizando lo que a principios de los cincuentas se conoca sobre el cerebro humano, y dise los primeros programas almacenados en la memoria de una computadora. Sin embargo, esta lnea de investigacin pronto encontr serias limitaciones. La concentracin en la imitacin de la constitucin fsico-qumica del cerebro, no permiti ver, a Von Neumann y sus seguidores, que la analoga sera mucho ms eficiente si se estudiaran las funciones del cerebro, es decir, sus capacidades como procesador de informacin. Corresponde a McCulloch, a mediados de los cincuentas, formular una posicin radicalmente distinta al sostener que las leyes que gobiernan al pensamiento deben buscarse entre las reglas que gobiernan a la informacin y no entre las que gobiernan a la materia. Esta idea abri grandes posibilidades a la IA. En esta lnea, Minsky (1959), uno de los padres fundadores de la IA, modific su posicin y sostuvo que la imitacin del cerebro a nivel celular debera ser abandonada.

11

Es ms o menos en esta poca que ocurre un evento que organizara y dara un gran impulso al desarrollo de la IA: el congreso en Darthmouth (1956). En este congreso, en el que se reunieron los padres fundadores de la disciplina, se lleg a la definicin de las presuposiciones bsicas del ncleo terico de la IA: 1. El reconocimiento de que el pensamiento puede ocurrir fuera del cerebro, es decir, en mquinas 2. La presuposicin de que el pensamiento puede ser comprendido de manera formal y cientfica 3. La presuposicin de que la mejor forma de entenderlo es a travs de computadoras digitales Desde fines de los cincuentas la investigacin en IA se expande y se multiplica en direcciones diversas. La capacidad simblica de las computadoras es estudiada, entre otros, por Shanon (1950) y por Newell, Shaw y Simon (1958) quienes disean el primer programa inteligente basado en su modelo de procesamiento de informacin. Este modelo de Newell, Shaw y Simon habra de convertirse pronto en la teora dominante en psicologa cognoscitiva. Algunos investigadores se dedicaron al estudio de la naturaleza del aprendizaje en las computadoras y a los procesos de reconocimiento de patrones visuales. Como resultado de ello Selfridge y Dinneen consiguen disear el primer programa capaz de aprender por experiencia (ver McCorduck, 1979). Basndose en los estudios sobre memoria asociativa, el equipo Newell-ShawSimon construy los primeros lenguajes de procesamiento de informacin (IPL-I, IPL-II) utilizados en el diseo de su "Logic Theorist Machine" que se convirti en la primera mquina "inteligente". Esta mquina fue capaz no slo de memorizar y aprender, sitio que consigui demostrar de una manera original y "creativa", es decir no prevista por sus creadores, algunos de los teoremas propuestos por Bertrand Russell en los Principios (Russell and Whitehead, 1925).
12

Desde sus orgenes la IA se relacion con juegos como el ajedrez y las damas, probablemente debido a que los juegos de mesa constituyen modelos de situaciones reales en las que hay que calcular, solucionar problemas, tomar decisiones, corregir errores, recordar, etc. A pesar de que esta lnea de investigacin ha sido casi totalmente abandonada en la actualidad, muchos de los avances tericos y metodolgicos de la IA se deben a ella. Por ejemplo, Samuel dise en 1961 un programa que jugaba damas y que era capaz de aprender de sus errores, es decir, era capaz de adaptar su comportamiento en relacin a eventos pasados. Lo pasmoso de este programa fue que, aunada a su capacidad de aprendizaje la de memoria, con el tiempo consigui derrotar invariablemente a su creador. El mismo resultado fue obtenido por Bernstein a travs de un programa que jugaba ajedrez (Boden, 1977). Los grandes "retos" entre computadoras y seres humanos se multiplicaron, siendo el ms famoso de ellos el que ocurri entre Dreyfus (un enconado crtico de la IA) y el programa Machack, en el que Dreyfus fue derrotado en un juego de ajedrez de varias horas. A principios de los sesentas, la IA comienza una fase distinta de su desarrollo. En 1962, McCarthy y Raphael inician sus trabajos sobre el diseo y la construccin de un robot mvil que llamaran "Shakey". La diferencia fundamental entre este robot y los programas en computadora utilizados hasta ahora por la IA, es que "Shakey" tendra que enfrentar el reto de interactuar con el mundo real en trminos de espacio, tiempo, movimiento, etc. En otras palabras, el robot tendra que tener alguna forma de "conocimiento" del mundo que lo rodeaba. Este reto inici una fuerte preocupacin en la IA por el estudio de la epistemologa y los procesos cognoscitivos. La discusin se centr alrededor de los problemas de la representacin mental o interna del conocimiento, la percepcin y los problemas del significado. La idea bsica de Raphael era la de reunir, en una sola, distintas mquinas con capacidad de aprender por experiencia, de reconocer patrones visuales, de modelar, de manipular smbolos, etc., y esperar que el todo fuera mayor que la suma de las partes. El resultado del experimento no fue el xito que Raphael esperaba, pero fue un logro sin precedente que hizo posibles avances muy importantes. El aprendizaje ms importante de esta experiencia fue la
13

comprensin de que el problema ms difcil por resolver en IA era el de construir una mquina capaz de funcionar con altos ni<,eles de incertidumbre, como lo hace un ser humano. Se hizo claro que construir una mquina que no lidiara efectivamente con la incertidumbre sera una de dos: o trivial, por la simpleza de la tarea, o imposible por la complejidad de la misma. Hacia mediados de los sesentas la IA se convierte en un rea en la que se interesan e interactan especialistas de diversas disciplinas: lgicos, psiclogos, matemticos, lingistas, filsofos, etc. Uno de los grandes temas de IA en esta dcada fue el estudio del lenguaje. En la mayora de los estudios iniciales sobre lenguaje, se atac el problema de disear una mquina que fuera capaz de traducir de un idioma a otro. El nfasis se hizo en el anlisis de la sintaxis, en lugar del significado, estrategia que se abandon relativamente pronto. Los investigadores interesados en esta rea de la IA pronto descubrieron que traduccin no es lo mismo que transformacin, y que, como consecuencia de ello, de alguna manera la mquina tendra que "entender" un texto antes de poder traducirlo. Los esfuerzos se orientaron hacia una definicin de la comprensin que pudiera simularse en una computadora. Con esta idea como lineamiento heurstico, se desarroll una serie de programas que exploraban esta serie de habilidades relacionadas con el lenguaje y la comprensin: el "orculo" de Phillips, "Sad Sam" de Lindzay que fue uno de los ms exitosos, y "Eliza" de Wizenbaum y Colby. (ver Boden, 1977). El programa de Lindzay se orient hacia el estudio del significado, connotativo y denotativo, y es capaz de hacer inferencias, conocer, y parafrasear sobre el mundo conocido. Eliza, por otra parte, consisti en un anlisis de la conversacin que se basa en la simulacin de una terapia psicolgica interactiva en la que el programa es el analista y el interlocutor es el analizado.

14

SINTETIZADORES DE VOZ
Un sintetizador de voz es un dispositivo que se encarga de la produccin artificial del habla humana. Un sintetizador de voz puede convierte el texto voz. La voz sinttica es una voz artificial (no pregrabada), generada mediante un proceso de sintetizacin del habla. Y la sntesis de habla es la produccin artificial del habla humana. El sistema usado con este propsito recibe el nombre de sintetizador de habla y puede llevarse a cabo a travs de un software o de un hardware. La sntesis de voz se llama a menudo en ingls text-to-speech (TTS), en referencia a su capacidad de convertir texto en habla. Sin embargo, hay sistemas que en lugar de producir voz a partir de texto lo hacen a partir de representacin lingstica simblica en habla. La calidad de una voz sinttica vendr dada por la naturalidad e inteligibilidad. La naturalidad de un sintetizador de voz se refiere a hasta qu punto suena como la voz de una persona real. La inteligibilidad de un sintetizador se refiere a la facilidad de la salida de poder ser entendida. Existen dos tecnologas principales usadas para generar habla sinttica: 1. Sntesis concatenativa: Se basa en la concatenacin de segmentos grabados de voz. Generalmente, la sntesis concatenativa produce resultados ms naturales, sin embargo, la variacin natural del habla y las tcnicas automatizadas de segmentacin de formas de onda resultan en defectos audibles, que conllevan una prdida de naturalidad. 2. Sntesis de formantes: No usa muestras de habla humana en tiempo de ejecucin. La salida se crea usando un modelo acstico; y los parmetros como la frecuencia fundamental y los niveles de ruido se varan durante el tiempo para crear una forma de onda o habla artificial. Muchos sistemas basados en sntesis de formantes generan habla robtica y de apariencia artificial, y la salida nunca se podra confundir con la voz humana.

15

Sin embargo, la naturalidad mxima no es siempre la meta de un sintetizador de voz, y estos sistemas tienen algunas ventajas sobre los sistemas concatenativos: La sntesis de formantes puede ser muy inteligible, incluso a altas velocidades (a menudo usada por los discapacitados visuales para utilizar computadores con fluidez), evitando los defectos acsticos que pueden aparecer con frecuencia en los sistemas concatenativos. Por otra parte, los sintetizadores de formantes son a menudo programas ms pequeos que los sistemas concatenativos porque no necesitan una base de datos de muestras de voz grabada, de esta forma, pueden usarse en sistemas empotrados, donde la memoria y la capacidad de proceso son exiguas. Por ltimo, dado que los sistemas basados en formantes tienen un control total sobre todos los aspectos del habla producida, pueden incorporar una amplia variedad de tipos de entonaciones, que no slo comprendan preguntas y enunciaciones Los sintetizadoras de voz son considerados perifricos de salida que suelen incluir un microprocesador, memoria ROM con programas y datos, un conversor D/A, un amplificador de audiofrecuencia y altavoz. La mayor parte de los dispositivos sintetizadores de voz tienen memorizados digitalmente cada uno de los fonemas o palabras que son capaces de emitir. Los datos que recibe un sintetizador procedente del ordenador corresponden a la identificacin de los fonemas o palabras a emitir. Una vez que se analiza el dato, se activa una rutina encargada de generar el sonido correspondiente. Para lograr la ms completa claridad en el habla, lo adecuado es almacenar pronunciaciones de palabras completas. Los sintetizadores de habla son muy tiles para ser usados por aquellas personas con discapacidades; por ejemplo, se utiliza un sintetizador de habla en programas de asistencia como los lectores de pantalla. Mucho antes del desarrollo del procesado de seal moderno, los investigadores de la voz intentaron crear mquinas que produjesen habla humana. El Papa Silvestre
16

II (1003), Alberto Magno (1198-1280) y Roger Bacon (1214-1294) crearon ejemplos tempranos de 'cabezas parlantes'. En 1779, el cientfico dans Christian Gottlieb Kratzenstein, que trabajaba en esa poca en la Academia Rusa de las Ciencias, construy modelos del tracto vocal que podra producir las cinco vocales largas (a, e, i, o, u). Wolfgang von Kempelen de Viena, Austria, describi en su obra Mechanismus der menschlichen Sprache nebst der Beschreibung seiner sprechenden Maschine ("mecanismo del habla humana con descripcin de su mquina parlante", J.B. Degen, Wien) una mquina accionada con un fuelle. Esta mquina tena, adems, modelos de la lengua y los labios, para producir consonantes, as como vocales. En 1837 Charles Wheatstone produjo una 'mquina parlante' basada en el diseo de von Kempelen, y en 1857 M. Faber construy la mquina 'Euphonia'. El diseo de Wheatstone fue resucitado en 1923 por Paget. En los aos 30, los laboratorios Bell Labs desarrollaron el VOCODER, un analizador y sintetizador del habla operado por teclado que era claramente inteligible. Homer Dudley refin este dispositivo y creo VODER, que exhibi en la Exposicin Universal de Nueva York de 1939. Los primeros sintetizadores de voz sonaban muy robticos y eran a menudo inteligibles a duras penas. Sin embargo, la calidad del habla sintetizada ha mejorado en gran medida, y el resultado de los sistemas de sntesis contemporneos es, en ocasiones, indistinguible del habla humana real. A pesar del xito de los sintetizadores puramente electrnicos, sigue investigndose en sintetizadores mecnicos para su uso en robots humanoides. Incluso el mejor sintetizador electrnico est limitado por la calidad del transductor que produce el sonido, as que en un robot un sintetizador mecnico podra ser capaz de producir un sonido ms natural que un altavoz pequeo.

17

El primer sistema de sntesis computarizado fue creado a final de la dcada de 1950 y el primer sistema completo texto a voz se finaliz en 1968. Desde entonces se han producido muchos avances en las tecnologas usadas para sintetizar voz. DESAFOS DE LOS SISTEMAS TEXTO A FONEMA Los sintetizadores de voz usan dos aproximaciones bsicas al problema de determinar la pronunciacin de una palabra basndose en su pronunciacin, un proceso que a menudo recibe el nombre de conversin texto a fonema o grafema a fonema, dado que fonema es el trmino usado por los lingistas para describir sonidos distintivos en una lengua. La aproximacin ms simple a este problema es la basada en diccionario, donde se almacena en el programa un gran diccionario que contiene todas las palabras de la lengua y su correcta pronunciacin. Determinar la pronunciacin correcta de cada palabra consiste en buscar cada palabra en el diccionario y reemplazar el texto con la pronunciacin especificada en el diccionario. La otra aproximacin para convertir texto en fonemas es la aproximacin basada en reglas, donde dichas reglas para la pronunciacin de las palabras se aplican a palabras para extraer sus pronunciaciones basadas en su forma escrita. Cada aproximacin tiene ventajas y desventajas. La tcnica basada en diccionarios tiene como ventajas ser rpida y precisa, pero falla completamente si una palabra dada no aparece en el diccionario, y a medida que crece el diccionario crecen los requerimientos de memoria del sistema de sntesis. Por otra parte, la tcnica basada en reglas funciona con cualquier entrada, pero la complejidad de las reglas crece sustancialmente a medida que se van teniendo en cuenta ortografas y pronunciaciones irregulares. Como resultado, casi cualquier sintetizador de voz usa una combinacin de las dos tcnicas. Algunos idiomas, como el espaol, tienen un sistema de escritura muy regular y la prediccin de la pronunciacin de palabras basada en deletreos es casi siempre
18

correcta. Los sistemas de sntesis de voz para este tipo de lenguajes generalmente usan un enfoque basado en reglas como el enfoque central para la conversin texto-fonema y auxilindose de diccionarios pequeos para algunas palabras de origen extranjero cuya pronunciacin no se deduce de la escritura. En otros como el ingls, dado que se trata de sistemas muy irregulares en su escritura, el enfoque se basa principalmente en diccionarios y slo para palabras no usuales se basa en reglas. Problemas de la voz sinttica

Rechazo por parte de los usuarios que no le perdonan su falta de naturalidad y su timbre robtico.

Los CTV (Conversores de Texto-Voz) producen voz, generalmente, voz de hombre. Hay varias razones que pueden explicar este hecho:

Una explicacin sociolgica obvia es que, hasta hace relativamente poco, las personas que trabajaban en los laboratorios eran hombres y stos empleaban su propia voz durante los experimentos.

La voz masculina ofrece mejor calidad sonora que la femenina. Esto se debe a que la frecuencia fundamental (primer armnico) de la mujer es bastante ms alta que la de hombre.

La forma de onda en la voz de mujer tiene un componente de oscilacin no peridica, que viene dado por una mayor frecuencia en la aspiracin, que resulta ms notable que la del hombre. Este componente de la excitacin glotal es difcil de modelar

adecuadamente.

19

En los ltimos tiempos han aparecido sintetizadores que utilizan voz de mujer de calidad aceptable, sin embargo, siguen sin alcanzar la calidad ofrecida por un sintetizador de similares caractersticas que emplee voz masculina. Lenguajes de etiquetas para sntesis de voz Hay un cierto nmero de lenguaje de etiquetas para la interpretacin de texto como voz de acuerdo con XML. El ms reciente es SSML, propuesto por el W3C, que tiene actualmente categora de borrador. Otros lenguajes de etiquetas de aparicin anterior son SABLE y JSML. Aunque cada uno fue propuesto como un nuevo estndar, ninguno ha sido ampliamente adoptado. Los lenguajes de etiquetas para sntesis de voz no son lenguajes de etiquetas para dilogo como VoiceXML, que incluye, adems de etiquetas de conversin texto a voz, etiquetas relativas a reconocimiento de voz y control de dilogo. En la actualidad existen infinidad de software que desempean esta tarea entre los ms reconocidos estn: LOQUENDO TTS Puede decir cualquier frase en varios idiomas y sexos, y permite descargarse lo que dice el intrprete, ms de uno advertir que este tema est ya muy visto pero no se trata de que se conozca o no los sintetizadores de voz sino lo que se est evolucionando en esta tecnologa en gran medida gracias a la tcnica concatenativa Unit Selection (Seleccin de unidades). El funcionamiento se basa en el uso de una base de datos de voz grabada que se organiza en diferentes unidades (fonemas, slabas, palabras, frases) y se crea un ndice en la base de datos basada en parmetros como la frecuencia fundamental, el pitch, la duracin, la posicin en la slaba y los fonemas.

20

TEXT ALOUD TextAlod es un programa basado para que no necesites leer los textos sino que ser el propio programa quien se encargue de leerlos en voz alta. Sin duda es ideal para cualquier persona con algn tipo de invalidez que le imposibilite del placer de la lectura. TextAloud permite guardar los textos reproducidos en ficheros MP3 o WAV, con lo que podremos acceder a ellos cada vez que queramos y no necesitas volver a usar el programa porque lo tiene guardado en su memoria. SOLDESCOT SodelsCot es un excelente sintetizador de voz que habla automticamente el texto copiado al portapapeles de Windows o tecleado por el usuario en cualquier aplicacin. Lee el texto copiado o tecleado en editores, navegadores, correos electrnicos, mensajera instantnea, etc. Su fiabilidad es sorprendente, y lo ms importante, todas las voces las reproduce en espaol. Algunas de las principales caractersticas de SodelsCot Estndar, son: - Lee el texto seleccionado, copiado o tecleado en cualquier aplicacin Windows. -Velocidad de habla configurable. -Posibilidad de grabar la voz en ficheros de audio WAV o MP3. -Conversin de ficheros de texto a WAV. - Diccionario para personalizar la pronunciacin de abreviaturas o palabras especiales. - Funciones para detener, pausar/reanudar, repetir la ltima lectura y avanzar/retroceder segn habla.

- Permite ejecutarlo en lnea de comandos con texto o fichero a leer o convertir a WAV. - Ventana de aumento de pantalla (lupa) pensada para deficientes visuales. - Enlaza al programa desde otras aplicaciones con DDE (especial para desarrolladores). - Posibilidad de pronunciar signos de puntuacin.
21

PROCESAMIENTO DE LENGUAJE NATURAL


El Reconocimiento Automtico del Habla (RAH) o Reconocimiento Automtico de Voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicacin hablada entre seres humanos y computadoras electrnicas. El problema que se plantea en un sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acstica, fontica, fonolgica, lxica, sintctica, semntica y pragmtica), en presencia de ambigedades, incertidumbres y errores inevitables para llegar a obtener una interpretacin aceptable del mensaje acstico recibido. Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar la seal de voz emitida por el ser humano y reconocer la informacin contenida en sta, convirtindola en texto o emitiendo rdenes que actan sobre un proceso. En su desarrollo intervienen diversas disciplinas, tales como: la fisiologa, la acstica, el procesamiento de seales, la inteligencia artificial y la ciencia de la computacin. Diseo de un sistema de RAH Aprendizaje Un aspecto crucial en el diseo de un sistema de RAH es la eleccin del tipo de aprendizaje que se utilice para construir las diversas fuentes de conocimiento. Bsicamente, existen dos tipos:

Aprendizaje Deductivo: Las tcnicas de Aprendizaje Deductivo se basan en la transferencia de los conocimientos que un experto humano posee a un sistema informtico. Un ejemplo paradigmtico de las metodologas que utilizan tales tcnicas lo constituyen los Sistemas Basados en el Conocimiento y, en particular, los Sistemas Expertos.

Aprendizaje Inductivo: Las tcnicas de Aprendizaje Inductivo se basan en que el sistema pueda, automticamente, conseguir los conocimientos necesarios a partir de ejemplos reales sobre la tarea que se desea
22

modelizar. En este segundo tipo, los ejemplos los constituyen aquellas partes de los sistemas basados en los modelos ocultos de Markov o en las redes neuronales artificiales que son configuradas automticamente a partir de muestras de aprendizaje. En la prctica, no existen metodologas que estn basadas nicamente en el Aprendizaje Inductivo, de hecho, se asume un compromiso deductivo-inductivo en el que los aspectos generales se suministran deductivamente y la caracterizacin de la variabilidad inductivamente. Ambigedad El lenguaje natural es inherentemente ambiguo a diferentes niveles:

A nivel lxico, una misma palabra puede tener varios significados, y la seleccin del apropiado se debe deducir a partir del contexto oracional o conocimiento bsico. Muchas investigaciones en el campo del

procesamiento de lenguajes naturales han estudiado mtodos de resolver las ambigedades lxicas mediante diccionarios, gramticas, bases de conocimiento y correlaciones estadsticas.

A nivel referencial, la resolucin de anforas y catforas implica determinar la entidad lingstica previa o posterior a que hacen referencia.

A nivel estructural, se requiere de la semntica para desambiguar la dependencia de los sintagmas preposicionales que conducen a la construccin de distintos rboles sintcticos. Por ejemplo, en la frase Rompi el dibujo de un ataque de nervios.

A nivel pragmtico, una oracin, a menudo, no significa lo que realmente se est diciendo. Elementos tales como la irona tienen un papel importante en la interpretacin del mensaje.

23

Para resolver estos tipos de ambigedades y otros, el problema central en el PLN es la traduccin de entradas en lenguaje natural a una representacin interna sin ambigedad, como rboles de anlisis. Deteccin de separacin entre las palabras En la lengua hablada no se suelen hacer pausas entre palabra y palabra. El lugar en el que se debe separar las palabras a menudo depende de cul es la posibilidad que mantenga un sentido lgico tanto gramatical como contextual. En la lengua escrita, idiomas como el chino mandarn tampoco tienen separaciones entre las palabras. Recepcin imperfecta de datos Acentos extranjeros, regionalismos o dificultades en la produccin del habla, errores de mecanografiado o expresiones no gramaticales, errores en la lectura de textos mediante OCR Componentes

Anlisis morfolgico. El anlisis de las palabras para extraer races, rasgos flexivos, unidades lxicas compuestas y otros fenmenos.

Anlisis sintctico. El anlisis de la estructura sintctica de la frase mediante una gramtica de la lengua en cuestin.

Anlisis semntico. La extraccin del significado de la frase, y la resolucin de ambigedades lxicas y estructurales.

Anlisis pragmtico. El anlisis del texto ms all de los lmites de la frase, por ejemplo, para determinar los antecedentes referenciales de los pronombres.

Planificacin de la frase. Estructurar cada frase del texto con el fin de expresar el significado adecuado.

24

Generacin de la frase. La generacin de la cadena lineal de palabras a partir de la estructura general de la frase, con sus correspondientes flexiones, concordancias y restantes fenmenos sintcticos y morfolgicos.

Aplicaciones Las principales tareas de trabajo en el PLN son:


Sntesis del discurso Anlisis del lenguaje Comprensin del lenguaje Reconocimiento del habla Sntesis de voz Generacin de lenguajes naturales Traduccin automtica Respuesta a preguntas Recuperacin de la informacin Extraccin de la informacin

Decodificador acstico-fontico Las fuentes de informacin acstica, fontica, fonolgica y posiblemente lxica, con los correspondientes procedimientos interpretativos, dan lugar a un mdulo conocido como decodificador acstico-fontico (o en ocasiones a un decodificador lxico). La entrada al decodificador acstico-fontico es la seal vocal convenientemente representada; para ello, es necesario que sta sufra un pre proceso de parametrizacin. En esta etapa previa es necesario asumir algn modelo fsico, contndose con modelos auditivos y modelos articulatorios.

25

Modelo del lenguaje Las fuentes de conocimiento sintctico, semntico y pragmtico dan lugar al modelo del lenguaje del sistema. Cuando la representacin de la Sintaxis y de la Semntica tiende a integrarse, se desarrollan sistemas de RAH de gramtica restringida para tareas concretas. Caractersticas de los sistemas existentes Los sistemas comerciales han estado disponibles desde 1990. A pesar del aparente xito de estas tecnologas, muy pocas personas utilizan el sistema del reconocimiento del habla en sus computadoras. Parece ser que muchos de los usuarios utilizan el ratn y el teclado para guardar o redactar documentos, porque les resulta ms cmodo y rpido a pesar del hecho de que todos podemos hablar a ms velocidad de la que tecleamos. Sin embargo, mediante el uso de ambos, el teclado y el reconocimiento del habla, nuestro trabajo sera mucho ms efectivo. Este sistema donde est siendo ms utilizado es en aplicaciones telefnicas: agencias de viajes, atencin al cliente, informacin etc. La mejora de estos sistemas de reconocimiento del habla han ido aumentando y su eficacia cada vez es mayor. Clasificacin Los sistemas de reconocimiento de voz pueden clasificarse segn los siguientes criterios:

Entrenabilidad: determina si el sistema necesita un entrenamiento previo antes de empezar a usarse.

Dependencia del hablante: determina si el sistema debe entrenarse para cada usuario o es independiente del hablante.

Continuidad: determina si el sistema puede reconocer habla contina o el usuario debe hacer pausas entre palabra y palabra.

26

Robustez: determina si el sistema est diseado para usarse con seales poco ruidosas o, por el contrario, puede funcionar aceptablemente en condiciones ruidosas, ya sea ruido de fondo, ruido procedente del canal o la presencia de voces de otras personas.

Tamao del dominio: determina si el sistema est diseado para reconocer lenguaje de un dominio reducido (unos cientos de palabras p. e. reservas de vuelos o peticiones de informacin meteorolgica) o extenso (miles de palabras).

Usos y aplicaciones Aunque en teora cualquier tarea en la que se interacte con un ordenador puede utilizar el reconocimiento de voz, actualmente las siguientes aplicaciones son las ms comunes:

Dictado automtico: El dictado automtico es, en el 2007, el uso ms comn de las tecnologas de reconocimiento de voz. En algunos casos, como en el dictado de recetas mdicas y diagnsticos o el dictado de textos legales, se usan corpus especiales para incrementar la precisin del sistema.

Control por comandos: Los sistemas de reconocimiento de habla diseados para dar rdenes a un computador (p.e. "Abrir Firefox", "cerrar ventana") se llaman Control por comandos. Estos sistemas reconocen un vocabulario muy reducido, lo que incrementa su rendimiento.

Telefona: Algunos sistemas PBX permiten a los usuarios ejecutar comandos mediante el habla, en lugar de pulsar tonos. En muchos casos se pide al usuario que diga un nmero para navegar un men.

Sistemas porttiles: Los sistemas porttiles de pequeo tamao, como los relojes o los telfonos mviles, tienen unas restricciones muy concretas de

27

tamao y forma, as que el habla es una solucin natural para introducir datos en estos dispositivos.

Sistemas diseados para discapacitados: Los sistemas de reconocimiento de voz pueden ser tiles para personas con discapacidades que les impidan teclear con fluidez, as como para personas con problemas auditivos, que pueden usarlos para obtener texto escrito a partir de habla.

28

ANTECEDENTES
Se dice que en 1700 AC aparece el trmino sordomudo en el cdigo hammurabi. Y en el ao 1500 AC se realiza la primera investigacin sobre el odo y la audicin en la india. En el ao 1500 DC Gernimo Crdanos ensea a su hijo sordo utilizando smbolos y para el aos 1520 Pedro Ponce de Len fue el primer educador de sordos, invento el mtodo oral y creo la primera de sordos en Espaa, y en l aos de 1521 Rudolf agrcola manifest que los sordos podan comunicarse por medio de la escritura, crea que hablar y escuchar estaba totalmente separadas de la misma. En 1584 San Salvador de Oe establece la primera catedral de terapias de lenguaje En 1615 Manuel Ramrez Carrin, oralistas, enseaba a nios sordos hijos de ricos 1620 se public el primer libro de lenguaje de seas por Bonnet En 1644 Jhon Bulwer escribi sobre cmo ensearle a hablar a los sordomudos y usar el labio lectura. En 1690 ms del 25% de la poblacin en Vineyard eran sordos e inventaron su propio lenguaje de seas. 1692 Joan Conrad analiz las articulaciones de la boca con el propsito de ensear a una perspectiva fontica. 1782 Sicard Roch fund una escuela para sordos. 1788 De lEpe public el primer diccionario de lenguajes de seas. En 1803 En Dinamarca se hace obligatoria la educacin para el sordo por ley. 1855 John Flournery un ex alumno de la escuela de sordo de Connecticut propone la creacin de un estado para sordos. El 28 de noviembre de 1867 se publica el decreto en el que Benito Jurez determina fundar la primera escuela nacional de sordomudos en Mxico. En 1921 Earl C. Hanson patenta el primer audfono Vacuum tube hearing 1957 Se realiza el primer implante coclear por ndre Di Jurno y Charles Eyries.
29

PLANTEAMIENTO DEL PROBLEMA


Desde hace tiempo la discapacidad es uno de los problemas por el cual no siguen estudiando, esto se debe a que existen pocos maestros que ensean por medio de seas. Existen aparatos para la sordera pero estos son muy caros y solo personas ricas tienen estos aparatos.

30

JUSTIFICACION
En nuestro pas como en el resto del mundo se reporta un incremento notable con respecto al ndice de natalidad de personas discapacitadas, es decir, nacen con algn mal o padecimiento gentico. En Mxico informa el INSTTITO NACIONAL DE ESTADISTICA GEOGRAFICA E INFORMATICA (INEGI), un 47% de la poblacin padece o sufre de alguna discapacidad y que el 12.5% de este son personas sordomudas. Con Base a las estadsticas y al gran nmero de personas con dificultad para hablar y/o escuchar y que no pueden adquirir educacin de buen nivel sin necesidad de acudir a escuelas especializadas se pretende crear un aparato, con ayuda y soporte de algunos dispositivos, con el fin de ayudar y promover la educacin y que sea igual para todos sin importar limitaciones fsicas o mentales.

31

METODOLOGIA

El prototipo consta de un pupitre en el cual tendr integrada una computadora, es decir, en la parte superior tendr una pantalla, y dentro del pupitre tendr las partes que componen una computadora el CPU, al igual que tambin tendr un micrfono el cual captara la voz del docente, contara con altavoces para que este pronuncie por medio de voz lo que el alumno escriba en la computadora. La pantalla de la computadora pobra ocultarse para que el alumno pueda usar el pupitre en otras actividades, como escribir en cuaderno u otras actividades.

32

RESULTADOS ESPERADOS Mejor la educacin para personas sordo-mudas El prototipo funcione correctamente El proyecto sea agradable para el trabajo Las personas con diferentes capacidades aprendan con el prototipo El prototipo sea empleado en diferentes niveles educativos.

Figura 5 PROTOTIPO

33

PROYECTOS FUTUROS
LIBRE APARCAMIENTO PARA DISCAPACITADOS

Figura 6.falta de tica

Cuantas veces no vemos espacios especialmente diseados para discapacitados que son utilizados por personas que no tienen ninguna limitacin motriz o enfermedad y que incluso abusan de que dichos espacios estn vacos y estacionan hasta indebidamente (vea figura 2).En lo personal este tipo de acciones nos causan mucho desagrado y descontento al saber que las personas no tienen el suficiente valor moral y tico para entender reglas demasiado simples y claras. Por lo cual nos gustara internarnos en esta problemtica y crear un dispositivo capaz de leer por medio de un lector infrarrojo y No. De serie o cdigos colocados en la parte de las placas delanteras de las autos de personas con alguna discapacidad, dicho cdigo sea automticamente detectado por el lector o de lo contrario, si el vehculo no cuenta con dicho permiso tome una imagen de las placas para posteriormente se aplique la sancin correspondiente.

34

BIBLIOGRAFIA
http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/toledo_c_mt/capitulo1.pdf http://noticias.universia.net.mx/tiempo-libre/noticia/2007/03/05/44579/peligrosilencioso-humanidad.html http://prezi.com/q_x7ygjqf2d7/linea-de-tiempo-de-la-cultura-y-la-educacion-delsordo/ http://www.sitiodesordos.com.ar/avances%20tecnol.htm Francisco Casacuberta Nolla. Congreso de la Lengua Espaola, Sevilla, 1992 Asuncin Moreno. Congreso de la Lengua Espaola, Sevilla, 1992 Tordera Yllescas, Juan Carlos (2011): "Lingstica computacional. Tratamientos del habla". Valencia: Universitat de Valncia. http://bvs.sld.cu/revistas/san/vol2_2_98/san15298.htm http://biblioteca.itam.mx/estudios/estudio/estudio10/sec_16.html http://www.tldp.org/HOWTO/Speech-Recognition-HOWTO/

35

También podría gustarte