Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
PROGRAMA SINTETICO
OBJETIVO GENERAL:
El alumno diseñará e implementará sistemas de reconocimiento de voz con base en los principios de
funcionamiento del sistema fonador, el auditivo y la teoría de la inteligencia artificial.
CONTENIDO SINTÉTICO:
METODOLOGÍA:
Búsqueda de información por parte del alumno de los temas del curso, haciendo énfasis en los fundamentos
formales de cada tópico y presentando problemas. Realización de prácticas que permitan al alumno familiarizarse
con el diseño y la implementación de sistemas de reconocimiento de voz, su diseño asistido con técnicas
computacionales y los sistemas abiertos de reconocimiento de patrones basados en UNIX.
EVALUACIÓN Y ACREDITACIÓN:
Tres exámenes que tendrán un valor de 70%. Entrega de un proyecto de reconocimiento de voz, para la 3ª.
Evaluación.
Resolución de ejercicios realizados en clases 10 %
Prácticas de laboratorio y reporte 10%.
Participación en actividades individuales y de equipo 10%.
BIBLIOGRAFÍA:
Bermúdez, Jesús Bernal, Bobadilla Sancho Jesús. Gómez Villa, Pedro. Reconocimiento de voz y fonética acústica,
Alfa omega, México, 2000. 332 págs.
Casa cubierta, Francisco. Vidal, Enrique. Reconocimiento Automático del Habla, Marcombo, México, 1987. 205
págs.
Hilera, José R., Martínez, Víctor J. Redes Neuronales Artificiales: Fundamentos, modelos y aplicaciones, Alfa
omega, México, 2000, 390 págs.
Martín del Brío, Bonifacio. Sanz, Molina Alfredo. Redes Neuronales y Sistemas Difusos, Alfa omega, 2ª Ed.
México 2002. 399 págs.
Recuero, López Manuel. Ingeniería Acústica, Editorial Paraninfo, España, 1999, 373 pags.
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
TIEMPOS ASIGNADOS
HORAS/SEMANA/TEORÍA: 3.0
HORAS/SEMANA/PRÁCTICA: 1.5
HORAS/SEMESTRE/TEORIA: 54
HORAS/SEMESTRE/PRACTICA: 27
HORAS/TOTALES: 81
FUNDAMENTACIÓN DE LA ASIGNATURA
La asignatura de Reconocimiento y Síntesis de Voz, requiere como antecedentes que el alumno haya adquirido los
conceptos formales de las asignaturas de “Señales y Vibraciones” y “Electroacústica y Transductores”. Así como la
teoría de construcción de instrumentos musicales acústicos (Acústica Musical). Es importante el dominio de la
propagación de ondas de baja frecuencia (subsónicas) y de alta frecuencia (ultrasónicas). También, el alumno deberá
conocer cómo funcionan las redes neuronales, la teoría de agentes, cadenas de Markov, los perceptrones entre
muchos otros sistemas que conforman la Inteligencia Artificial. Todos estos conocimientos son necesarios ya que
estos se aplican en las opciones de la Carrera de Ingeniería en Comunicaciones y Electrónica y cumplen para obtener
el perfil de la carrera de Ingeniería en Comunicaciones y Electrónica.
OBJETIVO DE LA ASIGNATURA
El alumno diseñará e implementará sistemas de reconocimiento de voz con base en los principios de funcionamiento
del sistema fonador, el auditivo y la teoría de la inteligencia artificial.
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
El alumno definirá los conceptos, términos, vocablos, y otros símbolos que se utilizan en el argot del reconocimiento
de patrones, de la inteligencia artificial. Explicará la teoría y el concepto básico de los fenómenos físicos (y algunos
psico-subjetivos) involucrado en la generación y reconocimiento de los sonidos utilizando máquinas y autómatas,
principalmente con base al procesamiento digital de las señales acústicas.
T P EC
1.1 Introducción. 1.5 3B,4B,6C
1.1.1 Historia de las señales acústicas.
1.1.2 Historia de la computación
1.1.3 Computación digital versus computación analógica. 1.5
1.1.4 Historia de la Inteligencia Artificial.
1.1.5 Visión artificial y el reconocimiento de patrones.
1.1.6 Audición artificial y el reconocimiento de sonido. 1.5 1.5
1.1.7 Síntesis de sonido. 3.0
1.1.8 Agentes, algoritmos genéticos, redes neuronales,
perceptrones, procesamiento paralelo y concurrente, 1.5
procesamiento distribuido.
ESTRATEGIA DIDÁCTICA
Búsqueda de información documental de la historia de la computación y de señales acústicas por parte del alumno.
Definición de conceptos en el reconocimiento de patrones de voz..
Técnicas grupales para la resolución de ejercicios; tareas y trabajos.
Utilización de recursos audiovisuales y de tecnología de punta, para el análisis de síntesis de sonidos.
Exposición por parte del alumno con asesoría y apoyo del profesor.
Participación del alumno en clase con exposiciones de redes neuronales.
Prácticas de laboratorio, con reporte técnico.
PROCEDIMIENTO DE EVALUACIÓN
Primer examen departamental unidades I, II y III 70%
Ejercicios realizados en clases 10%
Prácticas de laboratorio reportadas por los alumnos 10%
Participación en clase, en actividades individuales, y en equipo 10%
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
2.1 Vibraciones en: cuerdas, barras, placas, membranas, 1.5 1B, 3B, 6C
y esferas.
2.2 Transmisión del sonido, resonadores, y filtros.
2.3 Generación natural de la voz.
2.4 Procesamiento del ruido de fondo.
2.5 Dinámica del proceso de la escucha de voz 1.5
2.6 Transformada de Fourier 1.5
2.7 Transformada rápida de Fourier. 1.5
2.8 Síntesis de formas de onda.
2.9 Síntesis de la voz.
2.10 Análisis de la voz con espectrogramas. 1.5 3.0
ESTRATEGIA DIDÁCTICA
PROCEDIMIENTO DE EVALUACIÓN
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
3B, 4B, 6C, 7C
3.1 Hardware, computadoras analógicas, y 1.5
computadoras digitales.
3.2 El sistema operativo UNIX, Win32 , o Linux como 1.5
una máquina virtual.
3.3 Familia del lenguaje C: C, C++, C#, Java. 1.5
3.4 Programación con LISP y PROLOG.
3.5 Fundamentos de la programación gráfica. 1.5
3.6 Programación de entrada y salida de sonido.
3.7 Programación de varios procesos en paralelo. 3.0
3.8 Sistemas distribuidos en red. 1.5
ESTRATEGIA DIDÁCTICA
ROCEDIMIENTO DE EVALUACIÓN.
El alumno aplicará los fundamentos y las técnicas que gobiernan le ciencia de la inteligencia artificial en el
reconocimiento de patrones de sonido.
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
4.1 Filosofía y desarrollo de la Inteligencia artificial 1.5 2B, 3B, 7C, 6C,
4.2 Ingeniería del conocimiento. 1.5
4.3 Máquina de inferencias.
4.4 Interfase hombre máquina.
4.5 Sistemas expertos. 1.5
4.6 Computadoras masivamente paralelas.
4.7 El Coneccionismo como poder asociativo. 1.5 4.5
4.8 La algoritmia como poder deductivo. 6.0
4.9 Sociedades de agentes. 1.5
4.10 Sistemas emergentes. 1.5
ESTRATEGIA DIDÁCTICA
Búsqueda de información por parte del alumno para el análisis del desarrollo de la inteligencia artificial.
Técnicas grupales para la resolución de ejercicios; tareas y trabajos.
Utilización de recursos audiovisuales y de tecnología de punta.
Exposición por parte del alumno del análisis de sistemas expertos, con asesoría y apoyo del profesor.
Participación del alumno en clase.
Prácticas de laboratorio y reporte técnico.
PROCEDIMIENTO DE EVALUACIÓN
Segundo examen departamental unidades IV y V 70%
Ejercicios realizados en clases 10%
Prácticas de laboratorio reportadas por los alumnos 10%
Participación en clase, en actividades individuales, y en equipo 10%
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
El alumno explicará la arquitectura de las redes neuronales artificiales, los fundamentos básicos de los algoritmos
genéticos, la teoría de gentes, y describirá el funcionamiento de un perceptrón, orientado todo ello al reconocimiento
y producción de voz en casos estudiados.
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
5.1 Arquitectura de una red neuronal y sus características. 1.5 2B, 5B, 7C, 6C
5.2 Redes neuronales con conexión hacia adelante: el
perceptron. 1.5
5.3 Propagación hacia delante y hacia atrás.
5.4 Modelos de redes neuronales: Hopfield, de resonancia
adaptiva, y Kohonen, y otras. 1.5
5.5 Redes estocásticas: máquinas Boltzman y máquinas
Cauchi, y otras.
5.6 Aprendizaje supervisado y no supervisado. 1.5
5.7 Estructura de un algoritmo genético y sus 1.5
características.
5.8 Estructura de un agente como neurona artificial.
5.9 Caso de estudio: una red neuronal que escucha y
reconoce sonido. 1.5 6.0 3.0
PROCEDIMIENTO DE EVALUACIÓN
El alumno explicará los fundamentos del procesamiento de señales digitales, así como la programación de los
dispositivos digitales y electrónicos que han sido diseñados para este propósito.
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
6.1 Arquitectura de los Procesadores de Señales Digitales 1.5 1B,3B,6C,7C
(DSP’s, Digital Signal Processors).
6.2 Programación de DSPs . 1.5
6.3 Operadores y transformadores de señal.
6.4 Detectores de los parámetros de una señal.
6.5 Discriminación de instrumentos musicales. 1.5 3.0
6.6 Detectores de compás, tono, ritmo, entre otros
parámetros musicales. 1.5 6.0
ESTRATEGIA DIDÁCTICA
Búsqueda de información de procesadores de señales digitales por parte del alumno.
Técnicas grupales para la resolución de ejercicios, tareas y trabajos.
Utilización de recursos audiovisuales y de tecnología de punta.
Exposición por parte del alumno de operadores y transformadores de señal, con asesoría y apoyo del profesor.
Reporte de prácticas de laboratorio.
PROCEDIMIENTO DE EVALUACIÓN
Tercer examen departamental unidades VI, VII y VIII junto con el proyecto final 70%
Ejercicios realizados en clases 10%
Prácticas de laboratorio reportadas por los alumnos; 10%
Participación en clase, en actividades individuales, y en equipo. 10%
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
No. UNIDAD VII NOMBRE: Casos de Estudio: VOCODERS, CEPSTRUM, otros Sistemas Abiertos
Basados en UNIX.
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
ESTRATEGIA DIDÁCTICA
PROCEDIMIENTO DE EVALUACIÓN
Tercer examen departamental unidades VI, VII y VIII junto con el proyecto final 70%
Ejercicios realizados en clases 10%
Prácticas de laboratorio reportadas por los alumnos: 10%
Participación en clase, en actividades individuales, y en equipo: 10%
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
No.
TEMA TEMAS HORAS CLAVE BIBLIOGRÁFICA
T P EC
ESTRATEGIA DIDÁCTICA
Realización de consulta bibliográfica y desarrollo de un proyecto práctico de acuerdo con sus habilidades.
Asesoría dentro del aula y en el laboratorio por parte del profesor.
PROCEDIMIENTO DE EVALUACIÓN
Tercer examen departamental unidades VI, VII y VIII y Evaluación de resultados del proyecto. 70%
Ejercicios realizados en clases 10%
Prácticas de laboratorio reportadas por los alumnos: 10%
Participación en clase, en actividades individuales, y en equipo: 10%
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
Total. 27.0
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
CLAVE B C BIBLIOGRAFÍA
1 X Bermúdez, Jesús Bernal, Bobadilla Sancho Jesús. Gómez Villa, Pedro. Reconocimiento
de voz y fonética acústica, Alfa omega, México, 2000. 332 págs.
3 X Hilera, José R., Martínez, Víctor J. Redes Neuronales Artificiales: Fundamentos, modelos
y aplicaciones, Alfa omega, México, 2000, 390 págs.
4 X Martín del Brío, Bonifacio. Sanz, Molina Alfredo. Redes Neuronales y Sistemas Difusos,
Alfa omega, 2ª Ed. México 2002. 399 págs.
5 X Recuero, López Manuel. Ingeniería Acústica, Editorial Paraninfo, España, 1999, 373 págs.
6 X Gold Ben, Nelson Morgan, Spech and Audio Signal Processing: Prosessing an Perception
of Spech and Music, John Wiley & Sons Inc., 2000. 237 págs.
7 X Russel Stuar, Peter Norring, Artificial Intelligence: A Modern Approach, second edition,
Prentice-Hall, 2003. 310 págs.
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA ACADÉMICA
DIRECCION DE EDUCACIÓN SUPERIOR
2.-OBJETIVOS DE LA ASIGNATURA:
El alumno diseñará e implementará sistemas de reconocimiento de voz con base en los principios de
funcionamiento del sistema fonador, el auditivo y la teoría de la inteligencia artificial.
3.-PERFIL DOCENTE:
Ing. Flavio Mancera Olivares Ing. Rubén Juárez Barrientos Ing. Ernesto Mercado
Escutia
Ing. Miguel Ramírez Montiel. Ing. Guillermo Santillán Guevara M. en C. Jesús Reyes García