Está en la página 1de 22

Datos y ciclo de vida • Semana 1

ESCUELA DE NEGOCIOS

Directora: Lorena Baus

ELABORACIÓN

Experto disciplinar: Juan Pablo Armijo

Diseñador instruccional: Hernán Apablaza

Editora instruccional: Rocío Gómez

VALIDACIÓN

Experto disciplinar: José Fuentes Morales

Jefa de Diseño Instruccional: Adriana Contreras

EQUIPO DE DESARROLLO

AIEP

AÑO

2022

2
Tabla de contenidos
Aprendizaje esperado de la semana ........................................................ 5

Introducción ......................................................................................... 6

1. Ciencia de datos .............................................................................. 7

1.1. Conceptos claves de la ciencia de datos......................................... 7

1.2. Clasificación de tipos de datos ...................................................... 9

1.2.1. Escalas de medida ................................................................ 11

1.3. Organización de los datos .......................................................... 13

1.3.1. Datos estructurados ............................................................... 14

1.3.2. Datos no estructurados .......................................................... 14

1.3.3. Datos semiestructurados ........................................................ 15

1.3.4. Gráficas ............................................................................... 15

1.4. Análisis de datos y toma de decisiones ......................................... 16

1.4.1. Enfoque cuantitativo .............................................................. 18

1.4.2. Enfoque cualitativo ................................................................ 18

3
1.5. Uso de los datos para la optimización de los resultados.................. 19

Cierre ............................................................................................... 21

Referencias bibliográficas..................................................................... 22

4
Aprendizaje esperado de la semana

Caracterizan el concepto de datos y su rol en la toma de decisiones dentro de


una organización.

Figura 1. Datos y toma de decisiones


Introducción
¿Imaginaste alguna vez que los datos podían convertirse en una
herramienta para mejorar nuestro bienestar?

En todo ámbito de la vida hay datos, pero saber capturarlos, procesarlos e


interpretarlos es la clave para lograr los objetivos deseados.

La ciencia de datos es el área de la ciencia que tomará una de las mayores


relevancias en el futuro respecto a la toma de decisiones y a cómo es posible
anticiparse a distintos escenarios.

En esta semana, se introducen distintos conceptos que permiten comprender


que los datos, para ser tratados, deben ser clasificados y entendidos de
acuerdo con su naturaleza. De ello, nace la clasificación de los datos entre
categóricos, que hacen referencia a cualidades, y por otro lado a los datos
numéricos, que hacen referencia a cantidades, para luego ver las escalas de
medidas que debemos considerar sobre estos mismos.

Cuando obtenemos datos, estos pueden venir en diferentes estructuras, lo ideal


es que estén estructurados, pero cerca del 80% de los datos son no
estructurados, por lo que deben pasar por un proceso para ser interpretados.
Entre las dos estructuras, están los datos semiestructurados.

El objetivo de gestionar y manipular los datos es poder obtener información a


partir de ellos, ya sea desde un enfoque cuantitativo o cualitativo.

6
1. Ciencia de datos
Es aquella parte de la ciencia que busca obtener la mayor utilidad y
conocimiento a partir de la extracción, procesamiento e interpretación de
datos. Esto se realiza por medio del uso de tecnologías informáticas, el uso de
ciencias como las matemáticas y estadísticas, métodos científicos y sistemas de
información.

1.1. Conceptos claves de la ciencia de datos

• Datos: representación cuantitativa o cualitativa de una variable o atributo.

• Variable: es una característica de un grupo de datos que varía y toma un


valor o cualidad.

• Atributo: característica que define a un elemento.

• Business intelligence: la ‘inteligencia de negocio’ es el proceso por medio


del cual analizamos, procesamos y transformamos los datos en información
útil, que nos permite mejorar el proceso de toma de decisiones en una
empresa, con el fin de obtener beneficios y cumplir los objetivos propuestos
por la institución.

7
• Data mining: la ‘minería de datos’ es el proceso de extracción de datos
(automático o semiautomático), en donde se busca dar respuesta a un
problema u objetivo. Como la minería de datos se realiza con un objetivo
en específico, se busca encontrar tendencias, patrones y normas que
respalden al proceso. Se realiza utilizando diferentes técnicas y software
especializados, o bien, herramientas informáticas que permitan la conexión
entre las fuentes de datos y el medio donde los datos serán recopilados,
preparados, modelados y evaluados.

• Big data: el avance de la tecnología y lo que implica la aparición constante


de nueva información, nos enfrenta a grandes volúmenes de datos (big
data) que poseen una gran variedad, complejidad de uso y velocidad de
aparición, por lo que el uso de tecnología estándar hace difícil su gestión
y análisis, requiriendo nuevas tecnologías y técnicas que se ajusten a los
nuevos requerimientos.

• Data analytics: el ‘análisis de datos’ es el procesamiento y análisis del big


data, obteniendo información que nos permite tomar decisiones.

• Machine learning: el ‘aprendizaje automático’ es un conjunto de algoritmos


que son entregados a una máquina (computador), para que esté de
acuerdo con ciertas indicaciones, sea capaz de detectar tendencias o
patrones en los datos (por lo general big data) y con ello dar respuestas a
comportamientos futuros (predicciones). En el machine learning, la

8
máquina por medio de los algoritmos va aprendiendo, por lo que, de cierta
forma, obtiene una autonomía. Es por esto que el machine learning se
considera una parte de la inteligencia artificial.

• Deep learning: el ‘aprendizaje profundo’ es una variante del machine


learning, pero, a diferencia de este último, el cual aprende a base de
algoritmos, en el deep learning se crean capas de algoritmos que van
relacionándose entre ellos y a la vez aprendiendo de forma automática,
simulando el comportamiento de las neuronas en un ser humano, para sí
lograr tomar decisiones y crear predicciones.

• Inteligencia artificial: por medio de algoritmos, procesos de machine


learning, deep learning, etc., se dan las facultades a una máquina con el
fin de que replique las capacidades y comportamientos de un ser humano.

1.2. Clasificación de tipos de datos

Los datos pueden ser clasificados según si representan una cualidad


(categóricos) o cantidad (numéricos). Dentro de ellos se realizan subdivisiones
para ser precisos en su clasificación.

9
Tipo de datos Clasificación Definición
Categóricos Nominales Datos que reciben una clasificación y en donde el
(Cualitativos) orden no es relevante, pues no altera el resultado del
experimento. Ejemplo: estado civil, género, colores,
etc.
Ordinales Datos que reciben una clasificación y en donde el
orden es relevante, pues el resultado sí puede ser
alterado. Ejemplo: calificaciones de un examen,
posiciones en una carrera de 100 metros planos, etc.
Numéricos Discretos Dato que es posible contar e implica generalmente
(Cuantitativos) números enteros. Ejemplo: número de personas en
una ciudad, número de asistentes en un partido de
fútbol, etc.
Continuos Dato que es posible medir, pues su valor no es exacto
e implica generalmente el uso de números que son
fracciones o decimales. Ejemplo: el peso de una
persona, estatura, etc.
Datos de texto Datos que no pueden ser clasificados como números,
pero pueden contener algún número acompañado de
otro carácter. Ejemplo: ID, una clave, etc.

Tabla 1. Tipos de datos

A su vez, es necesario entender que los datos pueden ser medidos en escalas
que dan interpretación a su clasificación previa.

10
1.2.1. Escalas de medida

De acuerdo con Coronado, una escala de medida es “el conjunto de los


posibles valores que una cierta variable puede tomar” (2007, p. 106). De esta
manera, existen distintos tipos de escalas. A continuación, revisaremos las
escalas categóricas y numéricas junto con algunas de sus subvariedades.

Escalas categóricas: las escalas categóricas permiten interpretar y medir


variables cualitativas, y estas se subdividen en escalas nominales y ordinales.

• Escalas nominales: permiten clasificar los datos en categorías. Toma las


características, atributos o propiedades que puedan tener y que destaquen
en estos datos, asignando una etiqueta o identificador a los datos
clasificados.
El objetivo es hacer una clasificación netamente categórica, no cuantitativa,
y en donde cada categoría es diferente a la otra.
Si una variable nominal tiene dos categorías, se llama “dicotómica”
(ejemplo, el género: masculino o femenino) mientras que, en el caso de
tener tres o más categorías, se denomina ‘multicotónica’ o ‘policotónica’
(ejemplo, categoría ‘raza de animales’).

• Escalas ordinales: se evalúan características, y es posible clasificarlas y


ordenarlas. Pueden ser etiquetadas, darles un nombre y son jerarquizables.
Por ejemplo: si hay una carrera de automóviles y 3 logran cruzar la meta,
el primero en llegar recibirá la etiqueta de #1 lugar, el segundo la etiqueta
de #2 lugar y el tercero de #3 lugar. Si tomamos las etiquetas, nos damos

11
cuenta de que las tres son números, pero con esos números no podemos
hacer operaciones aritméticas, es decir, por ejemplo, no podemos sacar
un promedio de las tres primeras posiciones pues aquello no tiene lógica.

Escalas numéricas: las escalas numéricas permiten interpretar y medir variables


cuantitativas, y estas se subdividen en escalas de intervalo y de razón.

• Escala de intervalo: también conocidas como cardinales, toman tanto


características de las escalas categóricas nominales y ordinales, pero se
agrega el hecho de que es posible medir distancia entre dos categorías
distintas, obteniendo como resultado que en una escala todas las distancias
son las mismas.

Con esta escala, podemos dar respuesta a preguntas como: “cuánto” o


“de qué tamaño” es lo que se mide. Ejemplo: medición de temperatura en
escala Celsius.

Debemos considerar que el valor “0” es un dato relevante en esta escala y


se considera como un valor arbitrario o de origen, es decir, no es un valor
que representa que no exista nada. Por ejemplo, si medimos temperatura,
el que existan 0°C, no implica que no haya temperatura (ausencia de esta),
más bien, que la temperatura de momento es 0°C, y si la comparáramos
con la temperatura del día siguiente, podemos decir que la temperatura
subió, bajó o se mantuvo, y podemos calcular la diferencia entre ellas,

12
incluso, obteniendo valores negativos que podemos interpretar como
disminución de temperatura.

• Escala de razón: También conocida como escala de proporción o de


cocientes, posee características de las escalas ordinales y de intervalo, y a
diferencia de esta última, el valor “0” es absoluto, es decir, no hay valores
numéricos negativos. Por ejemplo, si medimos los ingresos de una persona,
no podemos decir que esta recibe un número negativo de ingreso, pues la
escala parte del cero, o bien, si medimos los gastos mensuales de una
familia, es posible decir que en un mes no tuvieron desembolsos
monetarios, pero no es posible decir que gastaron una cantidad negativa
de dinero.

1.3. Organización de los datos

Al momento de recopilar los datos, no siempre estos vienen con un orden


prestablecido y de sencilla interpretación, por el contrario, la mayor parte de
la información útil que requerimos para tomar correctas decisiones proviene
de datos desordenados, de compleja lectura, que es necesario tabular de
acuerdo con nuestros objetivos.

13
1.3.1. Datos estructurados

Es la forma ideal de encontrar información dentro de una base de datos, es


decir, está ordenada, organizada, es sencilla de interpretar y gestionar, y por
lo general los datos que contiene están en archivo tipo texto ordenadas por
filas y columnas, con su etiqueta correspondiente. Ejemplo: un archivo Excel,
una base de datos, etc.

El que sean datos ordenados permite trabajar de forma más simple con ellos,
de manera de obtener interpretaciones más rápidas e incluso desde una
manipulación manual. Aumenta la posibilidad de realizar predicción y
disminuye el riesgo de cometer errores en el análisis.

1.3.2. Datos no estructurados

Representan datos útiles que no están ordenados de la forma ideal antes


mencionada, por lo tanto, al ver los datos, no encontramos filas ni columnas
que nos permitan crear relaciones, así, para el ojo humano, no es posible
comprenderlos.

Como no poseen una estructura que nos permita interpretarlos de forma


sencilla, es necesario utilizar software especializados para poder buscarlos y
categorizarlos para luego obtener información, interpretarla y tomar
decisiones.

14
1.3.3. Datos semiestructurados

También conocidos como datos ‘parcialmente estructurados’ o que tienen un


nivel medio de organización, poseen una parte en donde los datos tienen un
orden y estructura, pero a su vez, otra parte en donde los datos están en un
formato que genera inconsistencias y dificultad de comprensión.

1.3.4. Gráficas

Para una mejor comprensión, se presenta un esquema que interpreta


gráficamente las estructuras de datos.

Figura 2. Representación gráfica de estructuras de datos

En relación con poder realizar gráficas a partir de las estructuras de datos,


solamente la estructurada permitirá graficar de forma rápida, incluso utilizando
herramientas estándar como Excel.

15
En caso de tener otra estructura, será necesario procesar los datos para luego
generar las visualizaciones que se desea. Ejemplo: se tiene la siguiente tabla,
en donde se muestra una columna de rango de edad y al lado una de ingresos.

Figura 3. Ejemplo de gráfica a partir de datos estructurados

Estos datos están ordenados, por lo que es sencillo poder realizar una gráfica
de barra que muestra el comportamiento de los ingresos a medida que avanza
el rango de edad, pudiendo interpretar que quienes tienen entre 40 y 44 años,
reciben mayores ingresos.

1.4. Análisis de datos y toma de decisiones

Hemos descrito los tipos de datos, las escalas de medición que tienen, la
estructura con la cual nos encontramos al buscarlos en las distintas fuentes de

16
datos, y así, hemos dado un ejemplo de cómo poder graficar una tabla muy
sencilla de datos estructurados, ideales para poder analizar.

Sin embargo, debemos entender que los datos por sí solos no expresan nada,
por lo que es nuestra responsabilidad como especialistas en el análisis de
datos, saber capturarlos, gestionarlos y sacar la mayor cantidad de
información a partir de ellos, para poder generar conclusiones que nos
permitan tomar decisiones.

La toma de decisiones a partir del análisis de datos consiste en recorrer todo


el proceso de recopilar los datos, analizarlos y verificar que estos han permitido
obtener información verídica, para luego desarrollar estrategias que permitan
tomar decisiones que permitan lograr beneficios, por ejemplo, a empresas
comerciales.

Por estas razones, los beneficios del análisis de datos en el ámbito empresarial
están relacionados con la posibilidad de conocer en mayor profundidad la
empresa, optimizar los procesos de pagos, mejorar la rotación de inventario,
crear estrategias de proceso de producción para alcanzar el óptimo, reducir
los costos variables e incluso fijos, disminuir los riesgo de inversión y
adquisición de nuevos activos que no sean necesarios para la organización,
así, permite hacer todo lo mencionado en un menor tiempo, siendo eficientes
en la toma de decisiones.

17
1.4.1. Enfoque cuantitativo

Dado los tipos de datos que son posibles de obtener y analizar, nos
enfocaremos en el análisis cuantitativo de una empresa para tomar decisiones.

Si tenemos una base de datos interna de la empresa que ha permitido registrar


la información contable de los últimos años, podemos ver su realidad
económica y financiera de forma sencilla y rápida, pues la historia de la
empresa nos permite ver qué sucedió en el pasado y tener una posición frente
a una toma de decisión que se está enfrentando en el presente.

En el enfoque cuantitativo, podemos fijarnos en el nivel de ventas, los costos,


gastos, los niveles de deudas, las inversiones realizadas, ratios financieras,
comportamiento del patrimonio, evolución de los créditos contraídos, etc.

Como podrán ver, los datos históricos son muy útiles para tomar decisiones,
así, con un historial de datos solvente, es posible simular escenarios futuros
para proyectarse como empresa en el mercado o tener una visión más amplia
del horizonte empresarial.

1.4.2. Enfoque cualitativo

Si consideramos los datos cualitativos, el análisis de este tipo de datos para


tomar de decisiones toma alta relevancia, pues este tipo de análisis captura
aquella información que el análisis cuantitativo no puede realizar. Por ejemplo,
medir la satisfacción laboral, capturar la opinión de los clientes respecto a los

18
servicios que se entregan, revisar en qué departamento de una empresa se está
produciendo el mejor desempeño laboral, etc.

En resumen, buscamos responder los cómo y porqué de lo que estamos


analizando en la empresa.

La recopilación de datos es muy importante, principalmente para este tipo de


enfoque se utilizan técnicas y herramientas como las entrevistas, encuestas,
debates, observaciones, etc., que luego se pueden etiquetar y guardar en una
base de datos para ser procesadas, interpretadas y a partir de ello obtener la
información que nos va a permitir tomar mejores decisiones.

1.5. Uso de los datos para la optimización de los resultados

Sin el uso de los datos como fuente de información para tomar decisiones, el
trabajo se hace tedioso, demoroso incluso podría ser imposible de ejecutar por
los costos de oportunidad involucrados.

El objetivo de poder optimizar los datos es que los análisis y toma de decisiones
se hagan de la forma más eficiente y eficaz posible, debido a que el tiempo es
un factor relevante en cualquier empresa competitiva que busca las mejores
oportunidades de negocio, así tomar una ventaja competitiva en el mercado
que se desempeñe. Si no utiliza los datos, literalmente, en un mundo
globalizado donde la información lo es todo, la empresa estaría obsoleta y
destinada al fracaso.

19
Los casos de empresas que han optimizado sus resultados a partir de los datos
son múltiples, pero en el día a día nosotros mismos hemos visto que estas
optimizaciones nos facilitan las actividades que realizamos como también las
sugerencias que se nos hacen para satisfacer necesidades.

Al iniciar por ejemplo una aplicación como Apple Music o Spotify, podemos
ver listas de sugerencias musicales de acuerdo a nuestros gustos y preferencias;
cuando vamos conduciendo y encendemos Google Maps, la aplicación nos
sugiera las rutas más adecuadas en tiempo real; cuando estamos viendo
YouTube, la publicidad sugerida en muchas ocasiones es sobre justamente
aquel tema que poco antes revisamos; o, por ejemplo, cuando le hablamos a
Siri o Alexa, estas IA son capaces de entender únicamente nuestra voz y a partir
de ello interactuar con nuestros requerimientos.

Todo esto nos muestra que empresas a partir de los datos han realizado
mejoras y desarrollados servicios que forman parte de nuestro día a día, así
también, empresas no ligadas al mundo tecnológico; por ejemplo, alguna
empresa que reparte encomiendas puede tomar estos servicios, cruzarlos con
sus propios datos y así optimizar sus envíos y tiempo de entrega, lo que al final
se traduce en menores costos y mayores beneficios.

Los datos son el futuro y ustedes forman parte de esto.

20
Cierre
Por medio del siguiente organizador gráfico, se destacan las ideas clave de
esta semana:

Ciencia de datos

Conceptos Clasificación Escalas de medidas Organización Análisis Optimizar resultados

Datos categóricos Datos numéricos Variables Categóricas Variables Numéricas Estructurados Toma de decisiones

Datos nominales Datos discretos Escala nominal Escala de Intervalo No estructurados Enfoque cuantitativo

Escala de Razón o
Datos ordinales Datos continuos Escala ordinal Semiestructurados Enfoque cualitativo
Proporción

21
Referencias bibliográficas
Coronado, J. (2007) Escalas de medición. Sistema Institucional de
Investigación de Unitec. Paradigmas, Vol 2 (2), pp. 104-125 ISSN
1909-4302. Recuperado de:
https://dialnet.unirioja.es/descarga/articulo/4942056.pdf

22

También podría gustarte