Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apunte Semana1 2022 (TDA101)
Apunte Semana1 2022 (TDA101)
ESCUELA DE NEGOCIOS
ELABORACIÓN
VALIDACIÓN
EQUIPO DE DESARROLLO
AIEP
AÑO
2022
2
Tabla de contenidos
Aprendizaje esperado de la semana ........................................................ 5
Introducción ......................................................................................... 6
3
1.5. Uso de los datos para la optimización de los resultados.................. 19
Cierre ............................................................................................... 21
Referencias bibliográficas..................................................................... 22
4
Aprendizaje esperado de la semana
6
1. Ciencia de datos
Es aquella parte de la ciencia que busca obtener la mayor utilidad y
conocimiento a partir de la extracción, procesamiento e interpretación de
datos. Esto se realiza por medio del uso de tecnologías informáticas, el uso de
ciencias como las matemáticas y estadísticas, métodos científicos y sistemas de
información.
7
• Data mining: la ‘minería de datos’ es el proceso de extracción de datos
(automático o semiautomático), en donde se busca dar respuesta a un
problema u objetivo. Como la minería de datos se realiza con un objetivo
en específico, se busca encontrar tendencias, patrones y normas que
respalden al proceso. Se realiza utilizando diferentes técnicas y software
especializados, o bien, herramientas informáticas que permitan la conexión
entre las fuentes de datos y el medio donde los datos serán recopilados,
preparados, modelados y evaluados.
8
máquina por medio de los algoritmos va aprendiendo, por lo que, de cierta
forma, obtiene una autonomía. Es por esto que el machine learning se
considera una parte de la inteligencia artificial.
9
Tipo de datos Clasificación Definición
Categóricos Nominales Datos que reciben una clasificación y en donde el
(Cualitativos) orden no es relevante, pues no altera el resultado del
experimento. Ejemplo: estado civil, género, colores,
etc.
Ordinales Datos que reciben una clasificación y en donde el
orden es relevante, pues el resultado sí puede ser
alterado. Ejemplo: calificaciones de un examen,
posiciones en una carrera de 100 metros planos, etc.
Numéricos Discretos Dato que es posible contar e implica generalmente
(Cuantitativos) números enteros. Ejemplo: número de personas en
una ciudad, número de asistentes en un partido de
fútbol, etc.
Continuos Dato que es posible medir, pues su valor no es exacto
e implica generalmente el uso de números que son
fracciones o decimales. Ejemplo: el peso de una
persona, estatura, etc.
Datos de texto Datos que no pueden ser clasificados como números,
pero pueden contener algún número acompañado de
otro carácter. Ejemplo: ID, una clave, etc.
A su vez, es necesario entender que los datos pueden ser medidos en escalas
que dan interpretación a su clasificación previa.
10
1.2.1. Escalas de medida
11
cuenta de que las tres son números, pero con esos números no podemos
hacer operaciones aritméticas, es decir, por ejemplo, no podemos sacar
un promedio de las tres primeras posiciones pues aquello no tiene lógica.
12
incluso, obteniendo valores negativos que podemos interpretar como
disminución de temperatura.
13
1.3.1. Datos estructurados
El que sean datos ordenados permite trabajar de forma más simple con ellos,
de manera de obtener interpretaciones más rápidas e incluso desde una
manipulación manual. Aumenta la posibilidad de realizar predicción y
disminuye el riesgo de cometer errores en el análisis.
14
1.3.3. Datos semiestructurados
1.3.4. Gráficas
15
En caso de tener otra estructura, será necesario procesar los datos para luego
generar las visualizaciones que se desea. Ejemplo: se tiene la siguiente tabla,
en donde se muestra una columna de rango de edad y al lado una de ingresos.
Estos datos están ordenados, por lo que es sencillo poder realizar una gráfica
de barra que muestra el comportamiento de los ingresos a medida que avanza
el rango de edad, pudiendo interpretar que quienes tienen entre 40 y 44 años,
reciben mayores ingresos.
Hemos descrito los tipos de datos, las escalas de medición que tienen, la
estructura con la cual nos encontramos al buscarlos en las distintas fuentes de
16
datos, y así, hemos dado un ejemplo de cómo poder graficar una tabla muy
sencilla de datos estructurados, ideales para poder analizar.
Sin embargo, debemos entender que los datos por sí solos no expresan nada,
por lo que es nuestra responsabilidad como especialistas en el análisis de
datos, saber capturarlos, gestionarlos y sacar la mayor cantidad de
información a partir de ellos, para poder generar conclusiones que nos
permitan tomar decisiones.
Por estas razones, los beneficios del análisis de datos en el ámbito empresarial
están relacionados con la posibilidad de conocer en mayor profundidad la
empresa, optimizar los procesos de pagos, mejorar la rotación de inventario,
crear estrategias de proceso de producción para alcanzar el óptimo, reducir
los costos variables e incluso fijos, disminuir los riesgo de inversión y
adquisición de nuevos activos que no sean necesarios para la organización,
así, permite hacer todo lo mencionado en un menor tiempo, siendo eficientes
en la toma de decisiones.
17
1.4.1. Enfoque cuantitativo
Dado los tipos de datos que son posibles de obtener y analizar, nos
enfocaremos en el análisis cuantitativo de una empresa para tomar decisiones.
Como podrán ver, los datos históricos son muy útiles para tomar decisiones,
así, con un historial de datos solvente, es posible simular escenarios futuros
para proyectarse como empresa en el mercado o tener una visión más amplia
del horizonte empresarial.
18
servicios que se entregan, revisar en qué departamento de una empresa se está
produciendo el mejor desempeño laboral, etc.
Sin el uso de los datos como fuente de información para tomar decisiones, el
trabajo se hace tedioso, demoroso incluso podría ser imposible de ejecutar por
los costos de oportunidad involucrados.
El objetivo de poder optimizar los datos es que los análisis y toma de decisiones
se hagan de la forma más eficiente y eficaz posible, debido a que el tiempo es
un factor relevante en cualquier empresa competitiva que busca las mejores
oportunidades de negocio, así tomar una ventaja competitiva en el mercado
que se desempeñe. Si no utiliza los datos, literalmente, en un mundo
globalizado donde la información lo es todo, la empresa estaría obsoleta y
destinada al fracaso.
19
Los casos de empresas que han optimizado sus resultados a partir de los datos
son múltiples, pero en el día a día nosotros mismos hemos visto que estas
optimizaciones nos facilitan las actividades que realizamos como también las
sugerencias que se nos hacen para satisfacer necesidades.
Al iniciar por ejemplo una aplicación como Apple Music o Spotify, podemos
ver listas de sugerencias musicales de acuerdo a nuestros gustos y preferencias;
cuando vamos conduciendo y encendemos Google Maps, la aplicación nos
sugiera las rutas más adecuadas en tiempo real; cuando estamos viendo
YouTube, la publicidad sugerida en muchas ocasiones es sobre justamente
aquel tema que poco antes revisamos; o, por ejemplo, cuando le hablamos a
Siri o Alexa, estas IA son capaces de entender únicamente nuestra voz y a partir
de ello interactuar con nuestros requerimientos.
Todo esto nos muestra que empresas a partir de los datos han realizado
mejoras y desarrollados servicios que forman parte de nuestro día a día, así
también, empresas no ligadas al mundo tecnológico; por ejemplo, alguna
empresa que reparte encomiendas puede tomar estos servicios, cruzarlos con
sus propios datos y así optimizar sus envíos y tiempo de entrega, lo que al final
se traduce en menores costos y mayores beneficios.
20
Cierre
Por medio del siguiente organizador gráfico, se destacan las ideas clave de
esta semana:
Ciencia de datos
Datos categóricos Datos numéricos Variables Categóricas Variables Numéricas Estructurados Toma de decisiones
Datos nominales Datos discretos Escala nominal Escala de Intervalo No estructurados Enfoque cuantitativo
Escala de Razón o
Datos ordinales Datos continuos Escala ordinal Semiestructurados Enfoque cualitativo
Proporción
21
Referencias bibliográficas
Coronado, J. (2007) Escalas de medición. Sistema Institucional de
Investigación de Unitec. Paradigmas, Vol 2 (2), pp. 104-125 ISSN
1909-4302. Recuperado de:
https://dialnet.unirioja.es/descarga/articulo/4942056.pdf
22