Está en la página 1de 19

Universidad de Valparaso

Escuela de Ingeniera civil en Informtica

Investigacin sobre antenas para


Mineria de Datos

Versin 1.0
09/2015

Contenido
Resumen............................................................................................................. 3
1.

Introduccin................................................................................................. 3

2.

Objetivos...................................................................................................... 4
Objetivos Generales......................................................................................... 4
Hiptesis.......................................................................................................... 4

3.

Descripcion DataSet.................................................................................... 4
Transformacion Dataset en formato ARFF.......................................................5

4.

Trabajo Prctico........................................................................................... 6
Datos Obtenidos............................................................................................ 12
Reglas de Asociacin..................................................................................... 15

5.

Conclusin................................................................................................. 16

6.

Bibliografa................................................................................................. 17

Resumen
El presente documento se encuentra dividido en cinco secciones, en
estas se apreciar una introduccin al tema planteado, para
posteriormente denotar los objetivos que persigue este trabajo y la
hipotesis que se pretende verificar, en el tercer punto se elabora un
analisis detallado sobre la hipotesis previamente definida, en donde se
utilizar como herramienta de apoyo Rapid Minner. Finalmente, se podr
apreciar un resumen con las conclusiones del autor en base a los
pormenores encontrados en la realizacin del trabajo prctico.

1. Introduccin
La telefonia celular y el internet movil, son cada vez mas importantes en
nuestras vidas cotidianas. Estos nos permiten comunicarnos con
nuestros seres queridos, trabajar, estudiar, e incluso ayudarnos frente a
situaciones de emergencia.
Segn un informe difundido por la Subsecretara de Telecomunicaciones,
el nmero de aparatos de la telefona mvil activos en Chile
lleg a los 24,1 millones en diciembre de 2012, estableciendo un
promedio de 1,38 telefonos por habitante 1, se espera que este
numero siga creciendo rapidamente, debido a los nuevos modelos y
mayores estandares que ofrecen las diferentes compaias telfonicas.
Sin embargo para que este sistema funcione de manera adecuada, es
decir, cumpla con permitir el envio y recepcion de informacion desde
cualquier ubicacin (dentro del pas), se requiere de una estructura que
permita establecer este enlace, a esto se le conoce como antenas.
Cada antena tiene un rea de cobertura determinada, el alcance de esta
cobertura depende de la potencia de la antena y del terreno donde se
encuentre ubicada. Adems cada una de estas, puede solo atender a un
numero limitado de llamadas, por lo que es necesario a medida que
incrementan los dispositivos moviles, aumentar la cantidad de antenas
disponibles por sector.
Desde el 11 Junio del 2012 en Chile se decreto una Ley, Ley de Torres,
que permite regular la instalacion de antenas en el pas, dentro de esta
ley se incluye una serie de restriccciones, que permiten ubicar al pas
dentro de los cinco paises mas exigentes en el mundo con respecto a
este tema.
Hoy en dia, la Subsecretara de Telecomunicaciones, dispone de un
registro con la ubicacin de cada una de las antenas dentro del pas,
adems de la fecha de aprobacin de esta misma. Estos datos, permiten
DiarioPyme, http://www.diariopyme.cl/subtel-chile-tiene-24-1-millones-decelulares-activos/prontus_diariopyme/2013-03-19/144258.html
1

generar mapas de ubicacin, y clasificacion por sector, sin embargo si se


examinan de forma mas detallada, pueden entregar informacion mas
especifica que no es tan fcil de inferir a simple vista.

2. Objetivos
Mediante este proyecto se pretende aplicar los conocimientos sobre
Mineria de Datos, tanto de forma terica como prctica, sobre los datos
que informa la SubTel acerca de la ubicacin de antenas.
Objetivos Generales
i. Establecer que empresa tiene mayor cantidad de antenas
instaladas en el pas.
ii. Conocer los lugares con mayor cantidad de
antenas
hablitadas.
iii. Desde la validez de la Ley de Torres, ha disminuido la
instalacion de antenas.
iv. Verificar la validez o rechazo de la hipotesis planteada.
Hiptesis

La cobertura de Entel en Chile, en el mbito de la telefonia movil, es mejor


en el centro de Chile(V,RM,VI), que en los extremos del pas, es decir, Norte
y Sur.
Para verificar esta hiptesis, es necesario utilizar la cantidad de
antenas y ubicacion de estas mismas para establecer una relacion
entre el nmero de antenas ubicadas en cada comuna y la
cobertura de estas. Con estos datos se podr obtener informacin
til, que permitira ver la variabilidad entre las ubicaciones y la
region donde se encuentra, a partir de ello se revisar si existe
mayor cantidad de antenas mientras mas al sur o al norte nos
ubiquemos.

3. Descripcion DataSet
Listado de antenas de telefona mvil, contiene los datos de
Autorizaciones de Estaciones Base (antenas) a nivel Nacional
desde Octubre 2013 hasta Abril 2015.
Estos datos provienen de la Subsecretaria de Telecomunicacines
del Gobierno de Chile, quien mantiene un registro de las
autorizaciones entregadas a las diferentes compaias moviles
para la instalacin de antenas.
El Data Set disponible cuenta con 24408 datos, sin embargo
debido a que el Software R no permite trabajar de forma optima
con esta cantidad de datos, es que se han eliminado las
autorizaciones que iban desde 1988 hasta 2013.
El Data Set con el que se trabajara consta de 24408 datos y
contiene 17 atributos o variables:

Empresa: Nombre de la empresa que instala la antena.


Servicio: Identifica si el servicio es publico o privado.

Tipo Servicio: Define para que se va a ocupar esta


antena.
Sistema: Detalla el tipo de red que ocupar el servicio.
Tipo elemento: Denota que es lo que se va a instalr,
antena, etc.
Direccin: Lugar donde se realiza la instalacion del
elemento.
Comuna: Zona urbana o rural donde se realiza la
instalacion de la antena.
Regin: corresponde a la regin donde se instala la
antena.
Lat_Grados: corresponde a la localizacin de un lugar, se
expresa en grados
Lat_Minutos: corresponde a la localizacin de un lugar,
expresado en minutos.
Las_Segundos: corresponde a la localizacin de un lugar,
expresado en segundo
Lon_Grados: La longitud es una medida de una dimensin, expresada

en grados.

Lon_Minutos: La longitud es una medida de una dimensin,

expresada en minutos.
Lon_Segundos: La longitud es una medida de una dimensin,
expresada en segundos.

Tipo Documento: Explica bajo que decreto o ley fue


aprobada la instalacion de las antenas.
Nro. Documento: Hace referencia al numero de
documento donde se encuentra la aprobacin.
Fecha Documento: Fecha en la que se emitio el
documento de aprobacion.

Tambien se utiliz otro dataset que solo entrega la cantidad


de habitantes por regin
Transformacion Dataset en formato ARFF
Para
comenzar
se
necesita
transformar
el
archivo
autorizacionAntenas.csv en formato .arff. A continuacin se
detallan los pasos utilizados para generar esta transformacion:
a) Previamente a la transformacion de archivo, se analiza el
documento revisando las variables de interes que permitiran
generar reglas que permitan emitir alguna conclusion respecto
a la hipotesis elaborada, las variables o atributos que no
aportan valor son eliminados.
b) Para crear el archivo arff se debe mantener las caracteristicas
bajo las cuales se estructura un archivo de este tipo, es decir,
se debe indicar el nombre de la relacion: @relation , los
atributos: @atributte y los datos: @data , esto se muestra en la
c)

Figura 1: Archivo en formato arff.

4. Trabajo Prctico
En este punto se describiran los pasos que se aplicaron para generar las reglas de
asociacion que permiten entender el comportamiento de los datos otorgados por el
dataset.
Para llevar a cabo la parte practica, se utiliz la herramienta Rapid Minner 6.5.0 con el
plugin Weka.
Para la carga del archivo, una vez realizado el punto 3, se debe proceder a la
carga del archivo generado, para realizar este procedimiento se debe ir a la zona
Filter y escribimos arff, tal como se aprecia en la
Figura 2.

Figura 2: Uso Filter

Seguidamente arrastramos el operador Read ARFF al Main Process.Sin


embargo como se requiere mezclar dos archivos debido a la relacion que existe
entre estos documentos, se repite el paso anterior, como se muestra en la Figura 3.
Finalmente en el Filter escribimos join,y arrastramos este operador al Main
Process como se muestra en la Figura 4 y 5, y se unen estos archivos.

Figura 3: Read ARFF en el Main Process

Figura 4: Filter Join

Figura 5: Unin ARFF

A continuacin, es necesario unir la salida out del Join con res del Main Process
como lo muestra la Figura 6.

Figura 6: Unin out- res

En la Figura 7, se muestran los resultados y la cantidad de


instancias y atributos que poseen estos resultados.

Figura 7: Data View

Dado que las variables que sern utilizadas son valores continuos y no nominales,
es preciso discretizar alguno de estos atributos para usar el algoritmo A priori. Las
variable discretizada fue Region. Para realizar este preoceso se busca el
Operators Discretize en el Filter, donde se muestran varias opciones. Para este
caso utilizaremos el Discretize by User Specification(Figura 8), que permite generar
clases segn la configuracion del usuario.

Figura 8: Filter con discretize

En la Figura 9 se aprecia el discretize agregado al Main Process, y en la Figura


10 se muestra la configuracion de esta discretizacion. La configuracin realizada al
Discretize, fue crear 3 intervalos para el atributo seleccionado, este se describe en
la Tabla 1.

Figura 9: Aplicar Discretize by User Specification

Figura 10: Configuracin discretize

Nombre
Regione
s

Norte
1,2,3,4,15

Centro
5,6,7,8,13

Sur
9,10,11,12,13,14

Tabla 1: Clases discretizadas

En la Figura 11, se muestran los datos entregados despus de aplicar la


discretizacion ya explicada anteriormente

Figura 11: Data View de Discretize

Finalmente para utilizar el algorimo A priori se utilizo un operador que permite


convertir los atributos numericos a nominal y asi trabajar con la clasificacion y las
reglas de asociacion que permite generar este algoritmo. En la Figura 12, se
muestra el diseo del resultado final en el Main Process.

Figura 12: Diseo Final Main Process

Sobre el Operador W- Apriori


Para comenzar con el anlisis de los datos previamente se definen los parmetros
que se utilizarn para generar las reglas de asociacin, estos parmetros se
explican a continuacin.
N: Es el nmero total de reglas que a lo ms deben ser mostradas.
T: Es la medida con la cual se clasifican las reglas

C: es el mnimo ndice de confianza que deben cumplir las reglas de


asociacion para que se muestren como resultado valido de la operacin a
priori,para el caso de estas pruebas se utilizo una confianza de 0.1 con el
fin de que genere la mayor cantidad de reglas de asociacin posibles y
posteriormente ir filtrando.
D: es la diferencia entre una regla y otra, la cual ser de 0,01 para as
poder representar amplia cantidad de reglas.
De los dems parmetros que existen dentro del operador W-Apriori, se
selecciona la letra I, la cual nos muestra todos los itemset y sus
respectivos tamaos.
En la Figura 13, se muestra la configuracin del W-Apriori.

Figura 13: Configuracin W-A priori

Datos Obtenidos
Para hacerse una idea de la disposicion de los datos, se generaron los siguientes
grficos, los cuales permiten generar alguna postura referente la hipotesis
planteada.
La Figura 14 muestra la distribucion de habitantes segn la zona donde viven en el
pais, de esta imagen se desprende que en la zona centro existen alrededro de
6.250.000 habitantes, mientra que en la zona norte y sur del pais los habitantes
bordean el 1.500.000

Figura 14: Distribucion de habitantes por Zona

En la Figura 15 y 16, se muestra la distribucin de antenas por zonas, en esta se


puede apreciar que la mayor concentracion de antenas se centra en la zona
central, seguida por aproximadamente 600 antenas instaladas en la zona Sur del
pas, por ltimo el Norte de Chile posee la menor cantidad de antenas autorizadas
para su instalacin.

Figura 15: Distribucin de antenas por zona

Figura 16: Cantidad de antenas por zona

En la Figura 17, se puede apreciar que las mayores compaias telefonicas(Claro,


Entel,Telefnica), tienen antenas instaladas a lo largo de todo el pas. Ademas se
aprecia que la distribucion de estas antenas por compaa es parecida, es decir, en
la distribucion de antenas por zona no se aprecia grandes variaciones entre una
compaa y otra.

Figura 17: Distribucin compaias por zona.

Reglas de Asociacin
En base a la configuracion del algoritmo a-priori, se han obtenido las siguientes
reglas de asociacin, las cuales se muestran en la Figura 18.

Figura 18: Reglas de asociacin.

Estas reglas de asociacion tienen distintos niveles de confianza, sin embargo de la


1 a la 11, son reglas obvias, que no permiten infereir algun comportamiento
especifico de estos dataset utilizados. Es por ello que solo se pondra atencion solo
en 2 reglas (12 y 13), sin embargo estas no aportan a la hipotesis planteada, y no
involucran las zonas en donde se instalan las antenas de las empresas de
telefonia.
En otras palabras, no existen reglas que permitan tener alguna postura sobre la
hipotesis planteada con anterioridad en el punto de los objetivos esperados.

5. Conclusin
De forma general se puede apreciar que la tecnologa cada vez hace
mayor uso de estos tipos de datos, con el fin de obtener
conocimientos que permitan guiar hacia alguna decisin.
Para el desarrollo, anlisis y verificacin de la hiptesis planteada en
un comienzo, como ya mencionamos antes fueron usadas las
tcnicas de asociacion de datos, mediante el uso de la herramienta
rapid Minner.
Con respecto a la hiptesis planteada en el punto hiptesis, no se
puede concluir respecto a ella, ya que los datos que comprende el
dataset no muestran ninguna relacion entre la zona de instalacion y
la compaa, es mas, se puede decir de forma arbitraria que faltan
mas datos o atributos que permitan generar una opinion profunda
sobre el tema de si la cantidad de habitantes esta intrinsicamente
relacionada con el numero de antenas instaladas, ya que tamposo se
puede concluir a ciencia cierta si es que la instalacion esta ligada en
forma porcentual a la cantidad de habitantes que existe en cada
region o zona del pas.
Para finalizar el tema de la hiptesis, se puede decir que esta no es
validada ni rechazada, debido a que las reglas de asociacion
obtenidas no muestran una realidad frente a los parametros
previamente expuestos, es entonces, que este dataset no se puede
utilizar para mostrar reglas de asociacin relacionadas a la hipotesis
descrita previamente.
Por otro lado el dataset antes descrito si bien posee muchos datos, no
tiene potencial para seguir siendo utilizado a lo largo del proyecto, ya
que no se pueden hacer muchas combinaciones ademas de las ya
realizadas, por lo que su alcance es pequeo, ademas los datos no
permiten hacerse una vision general, ni permite generar una opinion
afirmativa o negativa respecto a las hipotesis planteadas.

6. Bibliografa
i.

ii.
iii.

iv.
v.

Sistema
de
telecomunicaciones,
Informe
Sectorial:Telecomunicaciones
en
Chile,
2013,
link:
http://www.subtel.gob.cl/images/stories/apoyo_articulos/notas_pre
nsa/analisis_sectorial_dic2012_20130315.pdf
Sistema
de
telecomunicaciones,
Antena,
2011,
link:
http://www.subtel.gob.cl/antenas1/
Sistema de telecomunicaciones, Sector de telecomunicacion,
2014,
link:
http://www.subtel.gob.cl/wpcontent/uploads/2015/01/PPT-Series-Septiembre-2014-041214v1.pdf
Sistema de telecomunicaciones, Ley de Torres, link:
http://2010-2014.gob.cl/santiago-2-0/ley-de-torres-de-antenas/
RapidMinner
Studio
Core,
Join,link:
http://docs.rapidminer.com/studio/operators/data_transformation/s
et_operations/join.html

También podría gustarte