Está en la página 1de 33

Análisis de Datos

Unidad I
SEMANA 1
Recopilación de datos

www.iplacex.cl
SEMANA 1

Introducción

En la gestión empresarial, disponer de información oportuna, actualizada y de


calidad aporta ventajas significativas a la hora de tomar decisiones estratégicas.

Contar con buenos análisis de datos garantiza una buena calidad de información. Esta
información, una empresa la podría traducir en mejores estrategias comerciales y
también para la optimización de procesos con la detección a tiempo de oportunidades y
debilidades.

En el transcurso del curso, destacaremos la importancia del Análisis de Datos y


profundizaremos en las herramientas disponibles más comúnmente utilizadas. El
objetivo es que adquieras un conocimiento robusto sobre estas herramientas.

Este curso te convertirá en un profesional calificado y competente con habilidades para


analizar datos y convertirlos en información de valor.

En esta primera semana del curso veremos los conceptos básicos del análisis de datos
y la relevancia que tiene esta actividad en el ámbito empresarial. Definiremos
conceptos como “Dato”, “Información”, “Análisis de Datos” y “Tipos de Datos”.

Seguido a la definición de conceptos nos introduciremos en las herramientas de


análisis de datos elegidas para este curso.

2 www.iplacex.cl
Ideas Fuerza

1. La fuerza de los datos: Los volúmenes de datos son cada vez mayores y se
están convirtiendo en un activo importante para la empresa. Extraer la información
de estos datos es prioritario para tomar decisiones y plantear estrategias.

2. La importancia del análisis de datos: El dato por sí solo no representa


información. La información solo se obtiene del análisis de los datos. Un buen
análisis genera poderosa información.

3. Herramientas de análisis de datos: El conocimiento respecto de herramientas de


análisis de datos es imprescindible para un profesional de tecnología. No solo a
nivel de usuario sino como analista capaz de plantear soluciones a diversas
problemáticas.

3 www.iplacex.cl
Desarrollo
Unidad I.- Recopilación de datos

I.1.- Conceptos previos

Antes de dar una definición de “Análisis de Datos” revisemos los conceptos que
intervienen en la definición.

Dato

Un dato es una representación simbólica de un atributo o variable cualitativa o


cuantitativa. Un dato aislado puede no contener información relevante, solo cuando se
examina a la luz de un contexto este dato puede revelar información.

Variables Cualitativas.

Las variables cualitativas son aquellas que expresan características, cualidades


o atributos, y no pueden ser medidas con números. Estas pueden ser ordinales o
nominales.

Variable Cualitativa Nominal

Una variable cualitativa puede ser tratada como nominal cuando sus valores
representan categorías que no obedecen a una clasificación intrínseca.

Ejemplos
• La marca de los celulares de tus amigos.
• El color de ojos de los actores de una película.
• Series de televisión más vistas en el país.
• La tienda de ropa preferida por los habitantes de una ciudad.

4 www.iplacex.cl
Variable Cualitativa Ordinal

Una variable cualitativa puede ser tratada como ordinal cuando sus valores
representan categorías con alguna clasificación intrínseca.

Ejemplos:
• Los niveles de satisfacción con un servicio, que abarquen desde muy
insatisfecho hasta muy satisfecho.
• Escalas de actitud que representan el grado de satisfacción o confianza y las
puntuaciones de evaluación de las preferencias.
• Posición en la que llega un corredor en la prueba de 100 metros planos.

Variables Cuantitativas

Variables cuantitativas son aquellas que se expresan mediante un número, por


tanto, se puede realizar operaciones aritméticas con ellas. Puede ser discretas o
continuas.

Variable Cuantitativa Discreta

Una variable cuantitativa discreta es aquella que puede asumir un número


contable de valores.

Ejemplos:
• El número de hijos de una familia.
• La cantidad de dedos que tienes en la mano.
• El número de faltas en un partido de fútbol.

5 www.iplacex.cl
• Número de personas que llegan a un consultorio en una hora.
• El número de árboles que hay en un parque.
• Cantidad de empleados que trabajan en una tienda.
• Número de clientes que visitan un supermercado por día.

Variable Cuantitativa Continua

Una variable cuantitativa continua es aquella que puede asumir un número


incontable de valores.

Ejemplos:
• El ancho de una pelota de fútbol.
• Volumen de agua en una piscina.
• El peso de una persona.
• La velocidad a la que va a un tren.
• Longitud en centímetros de un tenedor.
• Peso de las vacas en una granja.
• El diámetro de una esfera.

¿Cuál es la diferencia entre Dato e Información?

Como ya se mencionó hay diferencia entre Dato e información para


comprenderlo veamos un ejemplo:

6 www.iplacex.cl
Si tenemos el siguiente dato “40.075”, este dato por sí solo no aporta
información. Pero si estamos hablando del perímetro de la Tierra este dato si nos
aporta información relevante.

¿Para qué puede servirte el Análisis de datos?

I.2.- Análisis de Datos

El análisis de datos es un proceso que consiste en recopilar y examinar los datos


con el objetivo de obtener conclusiones relevantes sobre la información. El análisis de
datos es usado por las empresas y organizaciones para tomar decisiones
empresariales. También es usado en las ciencias para verificar modelos o teorías
existentes.

¿Por qué es importante el análisis de datos?

7 www.iplacex.cl
Veamos a continuación algunas razones que justifican la importancia del Análisis
de Datos

Mercado exigente e innovador:

El mercado cambia muy rápido producto que el público cada vez es más
exigente y se adapta muy rápido al avance de las tecnologías. En este sentido la
analítica de datos, debe apoyar con información confiable y oportuna para la toma de
decisiones.

Las empresas requieren procesos ágiles de análisis de datos y de profesionales


capaces de realizar análisis efectivos.

De procesos generadores de datos a procesos centrados en los datos:

Si hasta hace poco tiempo atrás los procesos se centraban en generar datos,hoy
podemos decir que los datos se utilizan para generar procesos.

Por ejemplo, antes necesitábamos saber lo que compraban los clientes y se


creaban procesos para obtener la mayor cantidad de datos posibles. Hoy, esos datos
están, el desafío es crear procesos por ejemplo, para fidelizar clientes, estimar
períodos de mayor demanda, etc.

I.3.- Herramientas de Análisis de Datos


Existen muchas herramientas para el análisis de datos. En este curso usaremos
básicamente dos herramientas, estas son Excel y Access de Microsoft. La razón es
porque estas herramientas son tremendamente útiles y lo más importante es que son
ampliamente de uso común en muchas empresas y organizaciones. Por tanto, como
analista de datos estas herramientas deben estar en tus competencias y habilidades.

8 www.iplacex.cl
I.3.1.- Excel

Excel es un software de hojas de cálculo que forma parte de la suite ofimática de


Microsoft Office. Excel permite elaborar tablas que incluyen cálculos matemáticos
resueltos a través de operadores matemáticos o automáticamente mediante fórmulas o
funciones. Excel además, permite la visualización de los datos a través de Tablas y
Gráficos.

¿Qué son las Tablas de Excel?

I.3.1.1.- Tablas en Excel

Una tabla en Excel es un conjunto de datos organizados en filas y columnas. En


la primera fila se tiene los encabezados o nombres de las columnas o campos. El resto
de las filas contienen los datos propiamente tal.

Una tabla en Excel es similar a una tabla en una base de datos.

a) Beneficios de las Tablas en Excel

Tener los datos organizados en tablas tiene muchos beneficios. Algunos son:

• Almacenar los datos


• Realizar operaciones para analizar y administrar los datos
• Ordenar y resumir los datos
• Filtrar los datos según criterios
• Aplicar fórmulas

9 www.iplacex.cl
¿Cómo se crea una Tabla en Excel?

b) Crear Tablas en Excel

Los pasos para crear una tabla en Excel son los siguientes:

1.- Seleccionar el rango de celdas que contendrán los datos. Aquí se pueden dar
dos situaciones que las celdas ya contengan los valores o las celdas estén
vacías.

Situación 1: Las celdas ya contienen datos

Para crear una tabla con estos datos debemos seleccionar las celdas que
contienen los datos. Luego seleccionamos la pestaña “Insertar” y la opción
“Tabla”

10 www.iplacex.cl
Es importante marcar “La tabla tiene encabezados” ya que estos serán los
nombres de los campos.

Para cambiar el nombre a la tabla debemos estar en la pestaña “Diseño


de tabla” para esto solo basta con hacer clic en cualquier celda de la tabla.
Luego debemos editar el cajón con el nombre “Tabla1” para cambiarlo por
ejemplo por “Alumnos”.

11 www.iplacex.cl
Situación 2: Las celdas no contienen datos

En primer lugar, ubicamos en la primera fila los nombres de los campos.


Luego seleccionamos un rango de filas, vamos a la pestaña “insertar” y la opción
“Tabla”

12 www.iplacex.cl
Seleccionamos una celda de la tabla y hacemos clic en “Formulario”.

Con el formulario podemos ingresar todas las filas necesarias.

Importante: Si no tienes activo el icono “Formulario” en el material de estudio de


la semana te facilitamos un documento que describe el proceso de activación.

I.3.2.- Access
Access es un software que forma parte de la suite ofimática de Microsoft Office
que permite gestionar una base de datos. Access es una herramienta fácil de usar para
crear aplicaciones para seguimiento de información importante, creando o modificando
bases de datos. Access también permite una visualización de la información a través
de consultas e informes.

13 www.iplacex.cl
I.3.2.1.- Tablas en Access

Las tablas en Access y en las bases de datos en general son objetos de base de
datos que contienen todos los datos. En las tablas, los datos se organizan con un
formato de filas y columnas, similar al de una hoja de cálculo de Excel. Cada fila
representa un registro único y cada columna un campo dentro del registro.

a) Beneficios de las Tablas en Access

• Almacenar los datos


• Realizar operaciones para analizar y administrar los datos
• Ordenar y resumir los datos
• Filtrar los datos según criterios
• Aplicar fórmulas
Importante: Los beneficios de las tablas Access son los mismos que las tablas
de Excel. Quizás habría que discutir que es mejor para almacenar Tablas con datos,
Excel o Access, Este tema es para analizarlo para cada caso particular.

b) Crear Tablas en Access

Para crear una tabla en Access, en primer lugar, debemos crear una Base de
datos

Por ejemplo, crearemos la Base de datos “Base Prueba”

14 www.iplacex.cl
Creada la Base de datos corresponde crear la Tabla.

Para este ejemplo creemos una Tabla con dos campos País y Código de área

Para cambiar los nombres de los campos debemos ir a la pestaña “Campos”


opción “Nombre y título”.

15 www.iplacex.cl
Importante: “Nombre” es el nombre del campo y el que internamente se utiliza
para crear consultas. Por tanto, este nombre debe cumplir algunas exigencias como,
el largo, no acepta caracteres extraños, etc. “Título” es solo para la visualización.

Llamaremos “CODIGOS” a esta tabla.

16 www.iplacex.cl
I.4.- Recopilación de datos con Excel

Para obtener los datos que necesitemos analizar, Excel nos ofrece una interfaz
muy fácil e intuitiva a través de su cinta de opciones.

Para recopilar datos debes seleccionar la pestaña “Datos” y la opción “Obtener


Datos”.

17 www.iplacex.cl
Aquí nos aparecen varias opciones. Nos Enfocaremos en las dos primeras.

I.4.1.- Recopilación de datos “Desde un Archivo”

I.4.1.1.- Recopilación de datos “Desde un archivo” “Desde un libro”

Para ejemplo vamos a obtener los datos contenidos un archivo Excel llamado
“Tabla Clientes.xlsx”. Para esto vamos a seleccionar “Desde un libro”

18 www.iplacex.cl
Aquí navegamos hasta la ubicación del archivo deseado.

19 www.iplacex.cl
I.4.1.2.- Recopilación de datos “Desde un archivo” “Desde el texto/CSV”

¿Qué es un archivo CSV?

Un archivo CSV (comma separated values) es un archivo de texto que almacena


los datos en forma de columnas y las filas se distinguen por saltos de línea.

Como ejemplo, vamos a crear un archivo simple “csv”

Luego, recuperaremos su contenido a través de la opción “Desde el texto/CSV”

20 www.iplacex.cl
Es importante destacar que el formato “CSV” acepta varios tipos de
delimitadores.

21 www.iplacex.cl
I.4.1.3.- Recopilación de datos “Desde un archivo” “Desde un archivo XML”

¿Qué es un archivo XML?

Un archivo XML (Extensible Markup Language) es un lenguaje de etiquetas, es


decir, cada paquete de información está delimitado por dos etiquetas

22 www.iplacex.cl
Ejemplo:

Luego, recuperaremos su contenido a través de la opción “Desde un archivo XML”

23 www.iplacex.cl
24 www.iplacex.cl
I.4.1.4.- Recopilación de datos “Desde un archivo” “Desde JSON”

¿Qué es un archivo JSON?

El formato de archivo de JavaScript Object Notation (JSON) es un formato


estándar abierto basado en texto que se utiliza para serializar y transmitir datos
estructurados entre un servidor y una aplicación web.

Ejemplo de archivo “JSON”

25 www.iplacex.cl
Luego, recuperaremos su contenido a través de la opción “Desde JSON”

26 www.iplacex.cl
I.4.1.5.- Recopilación de datos “Desde un archivo” “Desde una carpeta”

27 www.iplacex.cl
Supongamos una carpeta llamada Ventas
que tiene dos archivos “2017.xlsx” y
“2018.xlsx”

I.4.2.- Recopilación de datos “Desde una base


de datos”

28 www.iplacex.cl
En este curso abordaremos la recopilación “Desde una base de datos de SQL
server” y “Desde una base de datos Access”.

I.4.2.1.- Recopilación de datos “Desde una base de datos” “Desde una base de
datos SQL server”

En este cuadro de dialogo ingresamos el nombre del servidor y la base de datos.


Para este ejemplo la Base de dato se llama “Marco” y la Base de datos se llama
“Agenda”.

29 www.iplacex.cl
Seleccionamos la tabla “Personas” y hacemos clic en “Cargar”

I.4.2.2.- Recopilación de datos “Desde una base de datos” “Desde una base de
datos Access”

30 www.iplacex.cl
En esta ventana seleccionamos la base de datos y hacemos clic en “Importar”

Esta ventana nos muestra una visualización de la tabla “Alumnos”. Hacemos clic
en “Cargar”

31 www.iplacex.cl
Conclusión
En esta primera semana, vimos una definición de conceptos importantes del
análisis de datos. Conceptos como “Dato” e “Información” y “Tipos de datos”, es
imprescindible entenderlos si queremos adentrarnos en el mundo del análisis de datos.

Se destaca la importancia de las herramientas, más comunes y usadas para el


análisis de datos, una de ellas es Excel y Access de Microsoft Office, que serán la
herramienta que usaremos en todo este curso.

Aprendimos a recopilar datos con la herramienta Excel para distintas fuentes de


datos. Con esto quedamos preparados para la etapa siguiente de la interpretación de
estos datos.

En la próxima semana veremos cómo recopilar datos con la herramienta Access


desde algunas fuentes externas completando el aprendizaje de recopilación de datos.
Destacaremos también la próxima semana la importancia de la organización de los
datos y de su representación gráfica.

32 www.iplacex.cl
Bibliografía
Reflexiones sobre ingeniería de requisitos y pruebas de software | Echeverri, Jaime | E-LIBRO
Aplicación de un oráculo de prueba automatizado a la evaluación de salidas de programas basados en
XML | Kim-Park, Dae S.; Riva, Claudio de la | E-LIBRO

33 www.iplacex.cl

También podría gustarte