Está en la página 1de 4

Tecnolgico de Estudios Superiores de Ecatepec

11 de abril de 2013

Diseo de un modelo basado en tcnicas de aprendizaje bayesiano aplicado a la prevencin del spam
Lic. Jos Carlos Prez Garca

Director: M. Francisco Jacob vila Camacho

Introduccin
Con el crecimiento de Internet y el correo electrnico se ha producido tambin un fuerte aumento de los correos no deseados (spam). En estos momentos aproximadamente el 60% de todos los correos que circulan por Internet son correos no deseados por sus receptores. Los correos no deseados son molestos, causan importantes problemas de seguridad, hacen perder tiempo, recursos y dinero a los usuarios, empresas y organizaciones, proveedores de servicios y de infraestructuras.

Problemtica
Durante la ltima dcada hemos asistido al uso generalizado del correo electrnico como herramienta de comunicacin en nuestra sociedad. Su utilizacin dentro de las organizaciones no escapa a esa tendencia y buena parte del flujo de informacin interno de una compaa se realiza de esta forma. El correo basura cuesta dinero, tanto por el tiempo que se pierde examinndolo, como por los recursos de hardware y software necesarios para manejarlo (ancho de banda, servidores de correo ms potentes, software de filtrado.), y los costes que deben ser soportados por las organizaciones en forma de inversiones y horas de trabajo de sus empleados, para evitar que sus buzones se saturen a causa de la recepcin de correo no til para la labor empresarial. Es claro que esto no slo presenta perjuicios a nivel empresarial; tambin para aquellos que hacen uso de una computadora personal en sus hogares es poco agradable encontrarse con su bandeja de entrada llena de correos basura. Adems, el costo derivado del problema del spam es cargado a los titulares de las cuentas de correo, quienes tienen que afrontar dos costos principales. Primero son cargados con altas tarifas por los proveedores de servicios de Internet los cuales deben invertir recursos para mejorar el equipamiento dedicado al manejo de alto volumen de correo electrnico, lidiar con las quejas de los usuarios y crear retos legales a los remitentes de correo basura. Y segundo, pueden incurrir adems en costos derivados del tiempo invertido en leer y/o borrar dichos correos. As, dichos costos producidos por el spam son asumidos por los receptores de los mismos y no por sus originadores.

Justificacin
Pocos son los resultados positivos que se han logrado al enfocarse en la solucin del problema, por eso es posible pensar en que la cultura y el conocimiento, son las armas ms eficaces para atraer resultados ptimos en la lucha contra el spam y sus mltiples implicaciones negativas, pues es as, como se puede exigir a los usuarios de los medios tecnolgicos un manejo responsable de estos. El combate contra el spam, y en general contra todas las prcticas negativas que involucra el uso de la red y las comunicaciones electrnicas, representa para la mayora de los pases y regiones afectadas un tema de fundamental atencin. Sin embargo, para aquellos con menor desarrollo resulta no slo una intensa lucha contra quienes desarrollan dichas prcticas negativas, sino adems contra la falta de conocimiento y su lento desarrollo tecnolgico, social, econmico y cultural. El spam es una prctica de innegable naturaleza negativa, cuya incidencia, cada vez mayor, y grado de impacto es motivo de preocupacin mundial. No obstante, en cada caso el impacto generado por el spam adquiere rasgos particulares de acuerdo a cada pas, pero esto no quiere decir que no se pueda trabajar conjuntamente en tratar de erradicar esta problemtica. De aqu parte nuestro inters por desarrollar nuestro proyecto de grado alrededor de este tema, porque es absolutamente necesario conocer el problema a fondo y estudiarlo intensamente para saber cmo atacarlo, como defendernos y pensar en posibles soluciones a proponer en beneficio de todos.

1.1 Objetivo general


Diseo de un modelo para la prevencin de spam basado en el mtodo aprendizaje Bayesiano.

1.2 Objetivos especficos

1.3 Objetivos particulares


EL tema de Tesis va a estar estructurado de la siguiente forma: Captulo 1: Es una introduccin donde se presenta el tema principal que se va a tratar a lo largo del proyecto, adems de los objetivos y la estructuracin del mismo. Captulo 2: Consiste en una presentacin acerca del spam, sus orgenes y su evolucin hasta la actualidad. Captulo 3: Estudio de los diferentes mtodos para la deteccin de correos no deseados (spam). Captulo 4: Explicacin del mtodo Aprendizaje Bayesiano para la deteccin del spam, realizando una clasificacin en funcin del tipo de tcnica empleada. Captulo 5: En este ltimo captulo se presentan las conclusiones obtenidas ms relevantes en este campo.