Análisis y Exploración de
Datos, utilizando SAS
Enterprise Guide.
Objetivo:
Al termino de la clase el participante estará en posibilidad
de:
Identificar los elementos básicos de la herramienta SAS
Enterprise Guide mediante el estudio de los componentes
de la herramienta con el objeto de incrementar la base de
conocimientos que proporciona la misma para la
explotación y análisis de datos.
2
Temario
1.Introducción
1.1 Conceptos básicos de la herramienta
1.2 Tipos de uniones de taba
2. Componentes de la herramienta
3. Caso práctico
4. Evaluación
3
1.1 Conceptos básicos de la herramienta
SAS Enterprise Guide:
• Interfaz visual para el desarrollo de procesos de
exploración, análisis y visualización de datos.
• Se apoya en el paradigma de desarrollo intuitivo, lo cual
permite que los usuarios finales construyan flujos de
información sin necesidad de programar.
4
Conceptos básicos de la herramienta
• Al utilizar SAS Enterprise Guide internamente, se está utilizando el
software SAS. Y cuando accedemos a los datos para crear tareas,
SAS Enterprise Guide genera un código SAS internamente.
• Cuando se ejecuta una tarea, el código generado se envía a los
servidores de la plataforma SAS que lo procesarán y devolverán los
resultados a SAS Enterprise Guide.
5
Descripción del flujo
• El usuario desarrolla un proceso en la herramienta.
• La ejecución del proyecto se realiza en el servidor de metadatos.
• El servidor de metadatos genera las conexiones necesarias a las
fuentes y ob?ene información requerida por el proyecto.
• El servidor de metadatos deposita la información en las librerías a las
que el usuario ?ene acceso, o en el área temporal (work).
6
Descripción del flujo
• El usuario explora, visualiza e inves?ga la información
con las funciones de la herramienta de forma dinámica
mediante la generación de un prompt con datos
internos o externos.
• Una vez que el usuario ob?ene el resultado de su flujo
se puede exportar la información a otros formatos por
ejemplo: Excel, PDF, Word.2
7
Data Set
Es un conjunto de datos que está compuesto por observaciones
y variables, las cuales representan las filas en un modelo
tradicional de base de datos y las columnas respectivamente.
8
Tipos de datos y formatos
• Tipo Alfanumérico: Se identifican gráficamente en la herramienta mediante
un ícono color rojo con forma piramidal, en cuyo interior se lee el caracter o
letra “A” al lado izquierdo del nombre de la variable.
• Tipo numérico: Se identifican a su vez con un ícono color azul de forma
esférica que contiene los números “1, 2 y 3” al lado izquierdo del nombre de
la variable como se muestra en la siguiente imagen.
9
Tipos de datos y formatos
• Las variables de tipo alfanuméricas pueden almacenar hasta
32,767 caracteres y a las variables numéricas se les puede
aplicar un “formato” para que representen números enteros,
de punto flotante, fechas, horas, minutos, segundos, valores
monetarios, etc.
10
Valor Missing
• Valor ausente o faltante en un data set = Valor “Missing”.
• Espacio en blanco: Cuando se trata de una variable
alfanumérica.
• Punto: Cuando la variable es de tipo numérica.
11
Valor Missing
• Aun cuando se muestra un punto o un espacio en blanco al
momento de visualizar el contenido de un data set para
indicar la presencia de un valor “missing”, no significa que el
punto o el caracter de espacio en blanco se encuentran
almacenados en el mismo.
12
Librería
• SAS utiliza el concepto de librería para organizar en forma
lógica los data sets (sistema de archivos).
• Permite almacenar y agrupar distintos archivos en una o más
carpetas. Dependiendo del tipo de librería (Permanente o
Temporal) y de las credenciales asociadas a las mismas.
13
Librería
• Usuario de la plataforma SAS: Generar, leer, escribir,
actualizar y eliminar uno o varios data sets almacenados o
asociados en una librería.
14
Librería Work
Librería especial ya que su propósito es el de almacenar en
forma temporal los data set generados en tiempo de ejecución
en un proyecto de Enterprise Guide cuando el usuario no
especifica una librería destino distinta.
15
Librería Work
La librería WORK, así como el espacio de almacenamiento
asignado a ella, se genera dinámicamente cuando el usuario
inicia sesión en la plataforma SAS desde Enterprise Guide, y al
momento de cerrar la sesión, automáticamente se elimina el
contenido de dicha librería.
16
1.2 Tipos de Unión
La funcionalidad de unión o "join" en términos de bases de datos
permite combinar registros de dos o más tablas a través de un
campo (llave) que permita identificar la relación que guardan los
datos de las tablas que se pretende unir.
17
Inner Join (Unión interna)
Con esta operación cada registro en la tabla del lado izquierdo es combinado
con cada registro de la tabla del lado derecho; pero en el resultado de la
operación (tabla combinada) sólo permanecen aquellos registros que
satisfacen las condiciones o criterios de búsqueda de registros coincidentes.
Este es el tipo de JOIN más utilizado, por lo que es considerado el tipo de
combinación predeterminado.
18
Left join (Unión izquierda)
El resultado de esta operación siempre contiene todos los registros de la tabla de
la izquierda (la primera tabla que se menciona en la consulta), aun cuando no
exista un registro correspondiente en la tabla de la derecha para uno de la
izquierda, en este caso la tabla combinada o resultado contendrá un valor missing
para los registros de la tabla derecha correspondientes.
19
Right join (Unión derecha)
Esta operación es inversa a la anterior (Left Join); el resultado de esta operación siempre
contiene todos los registros de la tabla de la derecha (la segunda tabla que se menciona
en la consulta), aun cuando no exista un registro correspondiente en la tabla de la
izquierda para uno de la derecha.
La operación RIGHT JOIN retorna la pareja de todos los valores de la tabla derecha con
los valores de la tabla de la izquierda correspondientes, o retorna un valor missing en
caso de no correspondencia.
20
Full join (Unión Completa)
Esta operación presenta los resultados de tabla izquierda y tabla
derecha aunque no tengan correspondencia en la otra tabla. La tabla
combinada contendrá, entonces, todos los registros de ambas tablas y
presentará valores missing para registros sin pareja.
21
2. Componentes de la Herramienta
Barra de menús
La barra de menús provee acceso ordenado a las distintas funciones
de la herramienta, agrupándolas por tipo, los menús más utilizados
son:
• Menú archivo.
• Menú tareas.
• Menú herramientas.
22
Componentes de la Herramienta
ü Menú Archivo
Desde el menú archivo se tiene la opción para abrir, crear
un nuevo proyecto, datos, programa, informe, proceso
almacenado, nota, flujo del proceso y lista ordenada,
importar y exportar datos.
23
24
ü Menú Tareas
El menú de tareas contiene las funciones propias de exploración,
análisis y visualización de datos, por ejemplo:
• Constructor de consultas: Permite extraer datos, así como aplicar
filtros y ordenamientos a los resultados de una consulta, así como
generar o calcular nuevas variables.
• Filtro y Orden: Permite filtrar y ordenar los datos almacenados en
un data set.
25
ü Menú Tareas
El menú de tareas contiene las funciones propias de exploración, análisis y
visualización de datos, por ejemplo:
• Concatenar tablas: Permite unir el contenido de dos o más data sets.
• Listar Datos: Permite generar un reporte a partir del contenido de un data
set.
• Diagramas o gráficos (Barras, tarta, Línea, Burbuja): Permite representar
el contenido de un data set en forma gráfica.
26
ü Menú Tareas
El menú de tareas contiene las funciones propias de
exploración, análisis y visualización de datos, por ejemplo:
• Tareas Analíticas: Análisis de la varianza, Regresiones
lineales, Regresiones no lineales, Correlación de
variables, Análisis de cluster o segmentos, Diagramas de
Pareto, Series de tiempo, por mencionar algunas.
27
28
ü Menú Herramientas
El menú “Herramientas” permite al usuario configurar la
herramienta para facilitar su uso de acuerdo a las características
de la plataforma SAS a la cual se conecta el usuario.
29
Recomendaciones para mejorar el uso de
la herramienta en la plataforma SAS del
SAT
30
1. Apertura automática de data set. En el menú de
herramientas, opciones, datos, general, deshabilitar la casilla
“Abrir los datos automáticamente cuando se añadan al
proyecto”.
31
2. Visualización de etiquetas. En el menú de herramientas,
opciones, datos, general, habilitar la opción “Usar etiquetasen
los nombres de las columnas”.
32
3. Limitar número de filas. Esta configuración evita que al
incorporar un data set al flujo de proceso, se abra en forma
automática y el usuario espere a que se descarguen todos los
datos almacenados en el mismo para poder visualizarlos.
33
4. Librería de Salida. Esta configuración asegura que el usuario disponga del
espacio temporal adecuado para su desarrollo, mismo que es asignado por el
administrador de la plataforma.
La imagen muestra la posición en la que debe de estar la librería WORK:
34
Link Demos
http://grp.elm.prod.sat.gob.mx:35493/home/ELMSCORM/
Cursos/007416/menuDemos.htm
35
PREGUNTAS
36
Datos de Soporte
• Datos de Soporte
1. Levantar reporte a mesa de servicio (RMA)
en “Mesa de Servicio SAT”, ext. 69999.
• Opción 1.
2. Solicite que asignen su reporte a “Mesa de
Ayuda SAS”.
37
Datos de Soporte
Especializado
ü Rodolfo Mendoza Martínez-
rodolfo.mendoza@sat.gob.mx
ü Ricardo Garcia Elvira –
ricardo.garciae@sat.gob.mx
ü Mario Alberto Castro Jaime -
mario.castro@sat.gob.mx
38
Temas de soporte
• Optimización de Proyectos.
• Generación de Macros.
• Gestión para el ingreso de nuevas fuentes a sus librerías.
• Enlace para proporcionar los diccionarios de datos .
• Dudas en general sobre el uso de la herramienta.
• Capacitaciones a un segundo, tercer y cuarto nivel de
SAS.
39
Portal de Transferencia de Conocimiento
http://10.228.128.93/index.php/en
40
GRACIAS
41