Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyectos
FOCA trabaja en modo proyecto que implica que todos los documentos han sido o van
a ser extraídos de una misma organización, con lo que se supone que la información que se
obtenga podrá ser cruzada en un proceso de análisis. Para ello, la herramienta permite
trabajar con una base de datos SQL Server para almacenar la información del proyecto. Esta
información permitirá volver a trabajar con ese proyecto. No se almacena ningún fichero en el
servidor de base de datos, simplemente se mantienen opciones de información del proyecto,
como los dominios, la fecha de creación y el estado. La conexión a la base de datos se
configura desde el menú Opciones, dónde además, como puede verse en la imagen, se
pueden configurar el número de hilos concurrentes para los procesos de descarga.
Creación de un proyecto
Una vez decidido si se quiere trabajar con o sin base de datos, se puede crear un
nuevo proyecto. Para ello hay que establecer el nombre del proyecto, el nombre del dominio
base y la carpeta dónde se van a almacenar todos los documentos que se descarguen.
Proyecto Rápido
Búsquedas
Una vez creado el proyecto, FOCA puede buscar todos los links de los ficheros
simplemente marcando las opciones de buscadores [Google o Live] y los tipos de ficheros a
buscar. Además, por comodidad se han añadido opciones de parada de la búsqueda.
Busqueda de ficheros
Descargas
Una vez decididos todos los ficheros que se desean descargar se puede dar a la
opción de descargar uno o todos. Esto arrancará la ejecución en paralelo de varios hilos de
proceso, uno por cada fichero, y creará un fichero vacío en la carpeta por cada fichero que se
va a descargar.
Descargando ficheros
Análisis de Metadatos de un fichero
Una vez que tenemos todos los documentos descargados podemos analizar
los metadatos de uno, varios ficheros o todos a la vez. De cada fichero va
buscar, en la última versión disponible, por la siguiente lista de
características:
– Metadatos personalizados
– URLs en Links
– Historial de uso
– Rutas a impresoras
– Rutas a versiones
– Datos EXIF en imágenes
Información EXIF embebida en ODF
Ficheros WPD
– Usuarios
– URLS en documentos
– Rutas a impresoras
Una vez analizados todos los metadatos de todos los ficheros que conforman
un proyecto es posible acceder a cinco listas de datos que se crean dinámicamente
durante el análisis.
Lista de Usuarios
Estos usuarios son extraídos de los campos creator, editor, autor, etc... de los
metadatos y la información oculta pero además también son extraídos de las rutas
encontradas. En este caso sería información perdida que se va a encontrar en las
rutas del tipo c:\users\chema\mis documentos, c:\Documents and settings\chema\desktop
o /home/chema/docs. Todos estos usuarios aparecerán en la lista.
Lista de Software
Software utilizado
¿Podría descubrir software pirata en una empresa? y también descubrir
tecnologías utilizadas y software vulnerable
Lista de Rutas
Estas rutas se sacan de todas las referencias a ficheros por ejemplo en rutas
a plantillas, rutas en links a archivos locales o imágenes incrustadas. Además, se
realiza una búsqueda desestructurada, es decir, con una búsqueda de strings que
cumplan patrones, por lo que aparecerán rutas también contenidas en el texto, en
links, en títulos, etc...
Lista de rutas
Lista de impresoras
Lista de mails.
Al igual que en el caso de las rutas se realiza una búsqueda en campos de metadatos
personalizados y una búsqueda desestructurada, es decir, que busca mails que
aparezcan dentro del contenido de los ficheros.
Mails encontrados
Seguimiento de datos
Una vez analizados todos los ficheros, se puede proceder a crear una imagen de la
red de la organización a partir de la información extraída.
Mapa de red generado
En la imagen se puede ver que todos los documentos creados por el mismo autor en
la misma máquina se agrupan para poder reconocer la máxima información de cada una de
las máquinas.
Falsos positivos
Hay que tener en cuenta, que en una web se pueden dar varias situaciones:
1) Datos de terceros: Puede ser que se esté publicando documentos que no tengan nada
que ver con la organización pues sea un fichero de otra organización que se publica en la
web.
2) Datos muy antiguos: Puede que un fichero tenga información muy antigua y que ya no sea
relevante para la construcción de la imagen de la red.
Para mitigar esos dos problemas en el caso de querer tener un dibujo lo más real posible de
la web se recomienda:
1) Hacer tracking de los datos externos para marcar los ficheros que no han sido creados
en la organización. Esto se puede hacer mediante un rápido análisis a las listas creadas
buscando mails que no tienen nada que ver con la organización o usuarios que aparecen en
otras empresas.
2) Una vez analizados los ficheros se pueden observar las fechas de creación con lo que es
posible detectar aquellos más antiguos.
Si se considera oportuno, todos esos ficheros se pueden eliminar del proyecto para
crear un análisis más acertado y con menos falsos positivos.
Consideraciones finales
La carpeta de creación del proyecto, donde se van a almacenar los documentos, debe
existir previamente, la herramienta, de momento, no crea la carpeta.
Se está trabajando en mejorar la herramienta, así que todos los comentarios, errores o
sugerencias de mejora que se reciban serán tomados en cuenta. El mail para enviarlos es
amigosdelafoca@informatica64.com.