Tesis Tecnologico

Universidad Continental de Ciencias e Ingeniería
Facultad de Ingeniería
Ingeniería de Sistemas e Informática
“Aplicación web para empresas con reconocimiento de voz y

análisis de tendencias en las radios por Internet en la ciudad de
Huancayo”
Tesis para optar el Título de Ingeniero de Sistemas e Informática
Ernesto Luismaria Pariona Díaz
Huancayo, Perú – 2017

CAPÍTULO I: PLANTEAMIENTO DEL ESTUDIO
1.1 Planteamiento y formulación del problema
Planteamiento del problema
Las empresas que realizan monitoreo de medios en nuestro país, en este caso particular, de
radios; los procesos que realizan para obtener información de las radios es rudimentario.
Designan a un persona que se sienta en un computador y empieza a oír un programa de una
emisora seleccionada para luego escribir un informe de dicho programa escuchado. Este es el
proceso para obtener información de un solo programa de radio de una emisora, ahora
imaginemos que necesitamos obtener información de muchos programas de radios de distintas
emisoras, es un proceso que demanda mucho tiempo y recursos.
Y esto no asegura que las empresas puedan tener un análisis eficiente de la información que
las radios brindan en sus programas, dando como resultado tendencias erróneas. Para reducir o
evitar este sesgo al momento de recopilar la información se necesita crear una herramienta que
realice de manera eficiente los procesos descritos anteriormente.
Requerimientos
• El sistema mostrara en cuadros estadísticos las palabras más comentadas en cada

programa analizado.
• La aplicación web se utilizara sin necesidad de instalar ningún software adicional en
un navegador web.
• Los usuarios deberán ingresar un nombre de usuario y contraseña.
• La aplicación web grabara la transmisión de la señal de radio por Internet en los
horarios establecidos por el usuario.
• El tiempo de aprendizaje de la aplicación web por un usuario deberá ser menor a 5
horas.
• La aplicación web contara con diseño responsivo para que se pueda visualizar en
múltiples dispositivos electrónicos como smartphones, laptops, pc de escritorios,
tablets.
• En la aplicación web no se podrá ingresar de direcciones web de las radios.
• El administrador será el único que puede cambiar los permisos de acceso de los
usuarios.
1.2 Objetivos
1.2.1 Objetivo general
• Grabar y reconocer las palabras del audio obtenidos de la señal de radio por streaming.
1.2.2 Objetivos específicos
• Grabar las palabras reconocidas del audio en un archivo de texto plano.

• Analizar el archivo de texto plano para encontrar las palabras que más se repiten.
• Generar un gráfico de tendencias con las palabras del archivo analizado.
1.3 Justificación
El presente proyecto tiene la finalidad de obtener información de los programas radiales para
saber que temas de interés local o nacional le dan importancia, para ello se va a desarrollar un
algoritmo que obtenga el audio de los programas de las emisoras y luego lo analice para
obtener las palabras que son las más concurrentes, siendo pertinente porque lograría hacer una
comparación de los temas que tratan cada emisora en sus programas radiales y con ello
obtener un análisis mucho más real de la coyuntura que vive una ciudad o el país.
CAPÍTULO II: MARCO TEÓRICO
2.1 Antecedentes del problema
La investigación de Willian Ignacio Gándara Hernández y Hugo Vladimir Pineda Perez (2015)
desarrollaron un proyecto sobre: Diseño e Implementación del Sistema de monitoreo de
medios para Komunikarte, explican que “el monitoreo de radio se lo realizaba con las
principales radios de Quito (Democracia, Visión, Quito) y las de Guayaquil (Sucre, Centro,
Caravana), se revisaban, ingresaban y digitalizan todas las notas periodísticas emitidas en los
programas de noticias, deportivos, de opinión y de variedades de las emisoras radiales
monitoreadas, tanto de los programas de la mañana, medio día, como de la noche, cubriendo
así todas las emisiones generadas por las distintas estaciones de radios.”(1)
En otra parte de la investigación añaden que “Años más adelante debido a la demanda de
inmediatez de los clientes y al lógico desarrollo tecnológico surgió la necesidad de reemplazar
esta metodología por sistemas tecnológicos administrativos de información que permitan
realizar actividades de seguimiento de información mediática que provean a la misma de
herramientas de gestión para una efectiva administración.”(2)
Según Carles Mateu(2004) define a las aplicaciones web como “un método para confeccionar
páginas dinámicas que permitiesen que lo mostrado fuese dinámico(generado o calculado a
partir de los datos de la petición). Dicho método fue conocido como CGI(common gateway
interface) y definía un mecanismo mediante el cual podíamos pasar información entre el
servidor HTTP y programas externos. Los CGI siguen siendo muy utilizados, puesto que la
mayoría de los servidores web los soportan debido a su sencillez. Además, nos proporcionan
total libertad a la hora de escoger el lenguaje de programación para desarrollarlos. El esquema
de funcionamiento de los CGI tenía un punto débil: cada vez que recibíamos una petición, el
servidor web lanzaba un proceso que ejecutaba el programa CGI. Como, por otro lado, la
mayoría de CGI estaban escritos en algún lenguaje interpretado (Perl, Python, etc.) o en algún
lenguaje que requería run-time environment (VisualBasic,Java, etc.), esto implicaba una gran
carga para la máquina del servidor. Además, si la web tenía muchos accesos al CGI, esto
suponía problemas graves. Por ello se empiezan a desarrollar alternativas a los CGI para
solucionar este grave problema de rendimiento. Las soluciones vienen principalmente por dos
vías. Por un lado se diseñan sistemas de ejecución de módulos más integrados con el servidor,
que evitan que éste tenga que instanciar y ejecutar multitud de programas. La otra vía consiste
en dotar al servidor de un intérprete de algún lenguaje de programación (RXML, PHP,
VBScript, etc.) que nos permita incluir las páginas en el código de manera que el servidor sea
quien lo ejecute, reduciendo así el tiempo de respuesta. A partir de este momento, se vive una
explosión del número de arquitecturas y lenguajes de programación que nos permiten
desarrollar aplicaciones web. Todas ellas siguen alguna de las dos vías ya mencionadas. De
ellas, las más útiles y las que más se utilizan son aquellas que permiten mezclar los dos
sistemas, es decir, un lenguaje de programación integrado que permita al servidor interpretar
comandos que “incrustemos” en las páginas HTML y un sistema de ejecución de programas
más enlazado con el servidor que no presente los problemas de rendimiento de los CGI.” (3)
Por otra parte Adobe System Software explica que “una aplicación Web es un sitio Web que
contiene páginas con contenido sin determinar, parcialmente o en su totalidad. El contenido
final de una página se determina sólo cuando el usuario solicita una página del servidor Web.
Dado que el contenido final de la página varía de una petición a otra en función de las
acciones del visitante, este tipo de página se denomina página dinámica.”(4)
El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es

explicada por José Andrés González López (2013) en su investigación: Reconocimiento
robusto de voz con datos perdidos o inciertos, como “el proceso mediante el cual la señal de
voz se transforma en texto a través de un programa informático. Esta tecnología se sitúa dentro
del marco más general del procesamiento de la voz, en el que se incluyen también otras
tecnologías como la síntesis de voz, la codificación de voz y la biometría por voz
(identificación y/o verificación de locutor). En general, estas tecnologías persiguen replicar
mediante una máquina la habilidad humana de escuchar, identificar y pronunciar frases de una
lengua dada. Otra tecnología muy relacionada con las anteriores y que suele ir de la mano de
éstas es el procesamiento del lenguaje natural, cuyo objetivo es modelar la capacidad humana
de comprender y procesar el contenido del lenguaje humano.”(5)
Para Juan Andrés Morales Cordovilla (2011) en su trabajo de investigación: Técnicas de
reconocimiento robusto de la voz basadas en el pitch, define que “Reconocer voz de forma
automática no es más que comparar una representación de la señal de voz con una serie de
patrones previamente establecidos. La implementación de los sistemas de ASR requiere el
desarrollo de dos etapas diferenciadas: una de entrenamiento, en la que se establecen los
patrones, y otra de test para validar el sistema. El que en la etapa de test no se obtengan
buenos resultados se debe principalmente a que la voz se presenta de una forma distinta e
incontrolable a la prevista por la etapa de entrenamiento.
Son muchas las formas en las que se puede presentar la voz y los investigadores que trabajan
en el problema del ASR suelen poner restricciones respecto a la cantidad de formas en las que
esta se puede presentar para así limitar el problema del reconocimiento.”(6)
Para Oscar Fernando Castellanos Domínguez, Aida Mayerly Fúquene Montañez y Diana
Cristina Ramírez Martínez(2011) tendencia “está asociada técnicamente al análisis de
mercado, con el objetivo de detectar y medir el comportamiento del precio y así determinar
acciones de compra-venta para participar en él. La tendencia no se limita a los mercados
financieros; en un sentido más amplio, una tendencia es un patrón de comportamiento de los
elementos de un entorno particular durante un período. En este sentido, el término análisis de
tendencia se refiere al concepto de recoger la información y de evidenciar un patrón, dinámica
o comportamiento a partir del procesamiento de esa información.”(7)
Para Alejandro Méndez Hoyos, Carlos Montiel Del Pino, Alberto Moreno González, Laura
Yanina Muñoz Azcurrain, Jorge Ayllón García, Sergio Castañeda Puche, Manuel de los Reyes
Del Valle García, Alejandro Jaime Núñez, José Pablo García López y Ángel López Martínez
(2013) radio online “Consiste en la transmisión de audio dotado de las características propias
del medio radiofónico(tales como su guión y su lenguaje) a través de la red mediante
streaming. El streaming es la posibilidad de distribuir recursos multimedia (texto, audio,
video) mediante el uso de una red de ordenadores en tiempo real, es decir, el usuario puede
consumir el producto al mismo tiempo que lo está descargando.”(8)
CAPÍTULO III: RESULTADOS ESPERADOS Y METODOLOGÍA
3.1 Resultados esperados
Realizado el proyecto se espera:
• Tener una aplicación que realice un reconocimiento del audio de los programas de
radios.
• Mejorar y optimizar el análisis de tendencias en las radios.
3.2 Plan del proyecto
El presente proyecto sera abordado siguiendo la metodología de desarrollo web: OOHDM

(Modelo de Diseño de Hipermedia Orientado a Objetos - Object Oriented Hypermedia Design
Model), el cual posee los siguientes procesos:
• Diseño conceptual.
• Diseño navegacional.
• Diseño de interfaz abstracta.
• Implementación.
CAPÍTULO IV: ASPECTOS ADMINISTRATIVOS
4.1 Presupuesto
Todos los gastos están expresados en soles.
Recurso Descripción Cantidad Total

Equipo Pc Escritorio 1 0
Papel Hojas para impresión 1 millar 22
Fotocopias 100 15
Gastos Internet 0 150
Luz 0 250
Total 437
4.2 Cronograma
Cronograma 2017-2018
Setiembre Octubre Noviembre Diciembre Enero Febrero Marzo
Descripción
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Definición del problema
Análisis de los requerimientos
Diseño conceptual
Diseño navegacional
Diseño de interfaz abstracta
Implementación de la aplicación web
REFERENCIAS BIBLIOGRÁFICAS
1) GÁNDARA HERNÁNDEZ, Willian Ignacio. PINEDA PÉREZ, Hugo Vladimir. Diseño e

Implementación del Sistema de monitoreo de medios para Komunikarte [en línea]. Tesis de
titulación. Universidad Politécnica Salesiana, Quito, 2015. pp.32-33.[consulta:10 de setiembre
del 2017]. Disponible en web: http://dspace.ups.edu.ec/handle/123456789/9678
2) GÁNDARA HERNÁNDEZ, Willian Ignacio. PINEDA PÉREZ, Hugo Vladimir. Diseño e

Implementación del Sistema de monitoreo de medios para Komunikarte [en línea]. Tesis de
titulación. Universidad Politécnica Salesiana, Quito, 2015. pp.41.[consulta:10 de setiembre del
2017]. Disponible en web: http://dspace.ups.edu.ec/handle/123456789/9678
3) CARLES MATEU. Desarrollo de aplicaciones web[en línea]. Barcelona: Eureca

Media,SL.2004.[Consulta: 10 de setiembre del 2017].Capítulo 1, pp.20-21.ISBN 84-9788-
118-4.Disponible en web: http://libros.metabiblioteca.org/handle/001/591
4) ADOBE SYSTEM SOFTWARE. Aspectos básicos de las aplicaciones web[en línea]

[Consulta: 10 de setiembre del 2017]. Disponible en web:
https://helpx.adobe.com/es/dreamweaver/using/web-applications.html
5) GONZÁLES LÓPEZ, José Andrés. Reconocimiento robusto de voz con datos perdidos o
inciertos [en línea]. Tesis doctoral. Universidad de Granada, Granada, 2013. pp.1.[consulta:10
de setiembre del 2017]. Disponible en web: http://digibug.ugr.es/handle/10481/29507
6) MORALES CORDOVILLA, Juan Andrés. Técnicas de reconocimiento robusto de la voz

basadas en el pitch [en línea]. Tesis doctoral. Universidad de Granada, Granada, 2011. pp.1.
[consulta:10 de setiembre del 2017]. Disponible en web:
http://digibug.ugr.es/handle/10481/19962
7) OSCAR FERNANDO CASTELLANOS DOMÍNGUEZ, AIDA MAYERLY FÚQUENE
MONTAÑEZ Y DIANA CRISTINA RAMÍREZ MARTÍNEZ. Análisis de tendencias:de la
información hacia la innovación[en línea]. Bogotá: Universidad Nacional de Colombia.2011.
[Consulta: 10 de setiembre del 2017].Capítulo 1, pp.20-21.ISBN 978-958-719-765-
5.Disponible en web:
http://www.bdigital.unal.edu.co/3564/1/ANALISIS_DE_TENDENCIAS_MAYO_7.pdf
8) ALEJANDRO MÉNDEZ HOYOS, CARLOS MONTIEL DEL PINO, ALBERTO

MORENO GONZÁLEZ, LAURA YANINA MUÑOZ AZCURRAIN, JORGE AYLLÓN
GARCÍA, SERGIO CASTAÑEDA PUCHE, MANUEL DE LOS REYES DEL VALLE
GARCÍA, ALEJANDRO JAIME NÚÑEZ, JOSÉ PABLO GARCÍA LÓPEZ Y ÁNGEL
LÓPEZ MARTÍNEZ. Nuevos tiempos para la industria radiofónica en España[en línea].
Málaga: Universidad de Málaga.2013.[Consulta: 10 de setiembre del 2017].La radio online.
Definición, evolución y tendencias, pp.100.ISBN 978-84-15774-82-2.Disponible en web:
http://www.eumed.net/libros-gratis/2013a/1312/index.htm

Tesis Tecnologico

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tesis Tecnologico

Cargado por

Copyright:

Formatos disponibles

Universidad Continental de Ciencias e Ingeniería

“Aplicación web para empresas con reconocimiento de voz y

Tesis para optar el Título de Ingeniero de Sistemas e Informática

Ernesto Luismaria Pariona Díaz

Huancayo, Perú – 2017

1.1 Planteamiento y formulación del problema

Planteamiento del problema

• El sistema mostrara en cuadros estadísticos las palabras más comentadas en cada

1.2.2 Objetivos específicos

• Grabar las palabras reconocidas del audio en un archivo de texto plano.

2.1 Antecedentes del problema

El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es

3.1 Resultados esperados

Realizado el proyecto se espera:

3.2 Plan del proyecto

El presente proyecto sera abordado siguiendo la metodología de desarrollo web: OOHDM

Todos los gastos están expresados en soles.

Recurso Descripción Cantidad Total

1) GÁNDARA HERNÁNDEZ, Willian Ignacio. PINEDA PÉREZ, Hugo Vladimir. Diseño e

2) GÁNDARA HERNÁNDEZ, Willian Ignacio. PINEDA PÉREZ, Hugo Vladimir. Diseño e

3) CARLES MATEU. Desarrollo de aplicaciones web[en línea]. Barcelona: Eureca

4) ADOBE SYSTEM SOFTWARE. Aspectos básicos de las aplicaciones web[en línea]

6) MORALES CORDOVILLA, Juan Andrés. Técnicas de reconocimiento robusto de la voz

8) ALEJANDRO MÉNDEZ HOYOS, CARLOS MONTIEL DEL PINO, ALBERTO

También podría gustarte