Está en la página 1de 12

Actividad de aprendizaje 3

CONTENIDO
Resumen…............................................................................................................ 3
Actividad............................................................................................................... 4
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la
organización…………………………………………………………….............. 5
2. Métodos de estimación de la dimensionalidad de los datos al interior de la
empresa ..……………………………………………………….......................... 6
3. Importancia los procesos de reducción de la dimensión de los datos dentro de la
organización.......................................................................................................... 7
4. Algoritmos locales de reducción de dimensiones de los datos dentro de la
organización…………………………………………………………………...... 8
5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos
dentro
de los sistemas de información y su impacto en la
empresa................................................................................................................. 9
6. Importancia de la correlación de las dimensiones dentro del análisis de los datos
de la
organización........................................................................................................ 10
7. Importancia de la calidad de los datos dentro de la
organización…………….................................................................................... 11
8. Importancia del procesamiento de los datos como generador de información
dentro de organización........................................................................................ 12
Referencias.......................................................................................................... 14
RESUMEN

En un mundo centrado en la generación y procesamiento de datos es de gran importancia


desarrollar un gran diferencial frente a los demás competidores en el sector empresarial.
El conocimiento más una acción, es lo que llamo una ventaja competitiva; y explotar los
datos para generar el conocimiento es lo que se debe hacer para apoyar a las empresas en
tres perspectivas: la Ciber seguridad, la gestión y Monitorización de la infraestructura
tecnológica y en la Inteligencia de negocio. Sin embargo, las empresas apenas empiezan
a comprender el valor de los DATOS. La transformación de varios sectores como el de
transporte y el turístico, en empresas como Uber o AirBnB, hace que las compañías
comiencen a entender cuál es el valor en el manejo de información sensible y
confidencial a través de plataformas digitales. Aunque queda mucho camino por recorrer,
ya se habla de que el valor de una empresa se mide, también, por los datos que maneja.
Lo que sí es cierto es que el 79% de las empresas afirman que el análisis de datos mejora
la toma de decisiones, según información arrojada por el Centro de Seguridad y
Vigilancia Digital (CSVD) de la compañía A3Sec. Asimismo las innovaciones de Big
Data aplicadas en los sectores financieros y salud, como, por ejemplo, el desarrollo de
herramientas de automatización de tareas que ayudan a reaccionar de forma rápida, eficaz
y oportuna han permitido identificar oportunidades y riesgos basados en los datos de la
compañía
ACTIVIDAD

Usted ha sido contratado como director de calidad de la información en una compañía


internacional que ha venido teniendo problemas con sus clientes en los últimos meses. Es
por esto por lo que le han solicitado generar un plan de acción para implementar un
proyecto de calidad de datos. La solución a estos problemas pasa por implementar
procesos de calidad adaptados a las necesidades de la empresa, basados en el control del
ciclo de vida de la calidad de los datos mediante un perfilado de la estructura y el
contenido y una limpieza. Por lo general, los pasos se dividen en distintas acciones, que
se llevan a cabo siguiendo el orden lógico: descubrir, analizar/definir, desarrollar,
revisar/analizar y monitorizar. Idealmente, además, la solución ha de ser global, no
departamental, si no desde un principio, al menos, sí a largo plazo. Además de
implementar un proyecto de calidad de datos, transformar pérdidas en beneficios requiere
contar con recursos humanos idóneos, tecnologías de vanguardia.
En esta tercera etapa se solicita generar en los equipos el siguiente documento en el que
deberán consultar y articular un documento que resuma:
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la organización.
2. Métodos de estimación de la dimensionalidad de los datos al interior de la empresa
3. Importancia los procesos de reducción de la dimensión de los datos dentro de la
organización. 4. Algoritmos locales de reducción de dimensiones de los datos dentro de
la organización.
5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos dentro
de los sistemas de información y su impacto en la empresa.
6. Importancia de la correlación de las dimensiones dentro del análisis de los datos de la
organización.
7. Importancia de la calidad de los datos dentro de la organización
8. Importancia del procesamiento de los datos como generador de información dentro de
la organización.
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la
organización.

Los datos son muy importantes en una organización porque es una colección completa de
prácticas, conceptos, procedimientos, procesos y una amplia gama de sistemas
complementarios que permiten a una organización obtener el control de sus recursos de
datos.

La gestión de datos como práctica general está relacionada con el ciclo de vida completo
de un activo de datos desde su punto de creación original hasta su retiro final.

Es decir, desde cómo avanza y cambia a lo largo de su vida útil a través de los flujos de
datos internos y externos de una empresa. Hay unos estándares de calidad de datos basados
no solo en las propias dimensiones de la calidad si no que al compartirlos con quien los
necesite, su estructura básicamente es como su nombre lo indica una estructura que puede
ser física o digital la cual nos permite realizar diferentes procesos como son editar, guardar
actualizar entre otros esto cumplen una función muy importante en las empresas ya que a
diario se da manejo a cualquier información de cualquier tipo.

Estos datos deben cumplir con su estándar de calidad Para ello, es básico realizar una
auditoría inicial o perfilamiento de los datos, con el objetivo de averiguar en qué estado se
encuentran éstos y a partir de ahí, detectar qué se debe corregir y a su vez determinar
parámetros de control que ayuden a medir el avance en los procesos de calidad. Estos
parámetros son conocidos como las seis dimensiones de calidad de datos y son
consideradas como los puntos clave que debe de cubrir la calidad de los datos para asegurar
nuestros procesos de limpieza y calidad.
2. Métodos de estimación de la dimensionalidad de los datos al interior de la
empresa

Los métodos de reducción de dimensionalidad son algoritmos que mapean el conjunto de


los datos a subespacios derivados del espacio original, de menor dimensión, que permiten
hacer una descripción de los datos a un menor costo. Por su importancia, son
ampliamente usados en procesos asociados a aprendizaje de máquina.
A este tipo de procesos que engloban este tipo de actividades podemos denominarlos
procesos estratégicos, y nos podemos encontrar algunos como: proceso de revisión del
sistema de gestión, proceso de establecimiento de políticas, proceso de establecimiento
de objetivos, etc., es decir, todos aquellos procesos que incluyan las actividades

Estos son algunos de los tipos de análisis de datos que puedes implementar para la
correcta toma de decisiones empresariales:
3. Importancia los procesos de reducción de la dimensión de los datos dentro de
la organización

Los sistemas de planificación de recursos empresariales son sistemas de gestión de


información que automatizan muchas de las prácticas de negocio asociadas con los
aspectos operativos o productivos de una empresa.

ERP como parte importante de la arquitectura del impacto que generan los proyectos
tecnológicos en las organizaciones, Una de las técnicas de pre procesado para modelos de
aprendizaje supervisado es la reducción de la dimensionalidad, que no es más que la
reducción del número de variables en una colección de datos y tiene como ventaja lo
siguiente

ü Reduce el espacio de tiempo y almacenamiento requerido.


ü La eliminación mejora el rendimiento del modelo de aprendizaje automático.
ü Se hace más fácil de visualizar los datos cuando se reduce a dimensiones muy
bajas tales como 2D o 3D.

4. Algoritmos locales de reducción de dimensiones de los datos dentro de la


organización

El análisis de correspondencias permite representar la información por medio de tablas de


contingencia, en ellas se recogen las frecuencias absolutas de las variables. Sería un
análisis equivalente al método de componentes principales, pero para atributos o
variables cualitativas. Por tanto, su aplicación está muy frecuentemente debido a que,
cada vez con mayor frecuencia, se recurre al estudio de variable de tipo cualitativo, lo
que supone que esta técnica asuma una mayor importancia dentro de las técnicas de
reducción de la dimensión.4.Algoritmos locales de reducción de dimensiones de los datos
dentro de la organización. La reducción de dimensiones se usa frecuentemente como una
etapa de preproceso en el entrenamiento de sistemas, y consiste en elegir un subconjunto
de variables, de tal manera, que el espacio de características que de acuerdo reducido a un
criterio de evaluación, cuya fin es distinguir el subconjunto que representa mejor el
espacio inicial de entrenamiento. Como cada característica que se incluye en el análisis,
puede incrementar el costo y el tiempo de proceso de los sistemas, hay una fuerte
motivación para diseñar e implementar sistemas con pequeños conjuntos de
características. Sin dejar de lado, que al mismo tiempo, hay una opuesta necesidad de
incluir un conjunto suficiente de características para lograr un alto desempeño. Esto ha
motivado el desarrollo de una variedad de técnicas que encontramos el subconjunto
óptimo a partir de un conjunto inicial de características. Sin embargo, muchas de esas
técnicas solo pueden manipular ciertos tipos de datos. Un conjunto de variables óptimo
para un conjunto de datos será el que contiene las variables más significativas del
conjunto de datos original. Para seleccionar las variables se siguen diferentes criterios. Ya
bien sea por conocimiento en el campo o por lógica, podemos intuir cuáles son las
variables más significativas. Pero no siempre podemos estar seguros de que el color de
los ojos no influye en la probabilidad de padecer cáncer o quizá no queramos arriesgar a
hacer tal afirmación. Puede ser que tengamos variables redundantes en nuestro conjunto
que tuvieran una correlación entre ellas suficientemente fuerte como para que no merezca
la pena tener las dos. Por ejemplo, siguiendo con nuestro ejemplo de predicción de
cáncer, quizá teniendo la variable de capacidad pulmonar, no merece la pena tener
también la variable que indica si es fumador o no, ya que puede que esta última esté, de
una forma u otra, ya recogida en la primera. Existe software, gratis por cierto, como
WEKA, que con un par de clics te dice con qué variables se quedaría y con cuáles no.
Tan solo hay que cargarle la colección de datos, contarle qué criterios y estrategias
quieres llevar a cabo, y darle a un botón mágico.

5. Interpreta los métodos globales de reducción de la dimensionalidad de los


datos dentro de los sistemas de información y su impacto en la empresa.

Selección de variables
Un conjunto de variables óptimo para un conjunto de datos será el que contiene las
variables más significativas del conjunto de datos original. Para seleccionar las
variables se siguen diferentes criterios.
En la práctica, la matriz de correlación de los datos se construye y en esta matriz se
calcula los auto vectores. Los vectores propios que corresponden a los valores
propios más grandes se pueden utilizar ahora para reconstruir una gran fracción de la
varianza de los datos originales. La técnica resultante es capaz de construir
asignaciones no lineales que maximizan la varianza en los datos.
Una técnica de reducción de dimensionalidad que se utiliza a veces en neurociencia es las
dimensiones informativas al máximo, que encuentra una representación de menor
dimensión de un conjunto de datos de tal manera que tanto información mutua como sea
posible sobre el original los datos se conservan.

6. Importancia de la correlación de las dimensiones dentro del análisis de los


datos de la organización.

Es una técnica de análisis de información con base estadística y, por ende, matemática.
Consiste en analizar la relación entre, al menos, dos variables - p.e. dos campos de una
base de datos o de un log o raw data-. El resultado debe mostrar la fuerza y el sentido de
la relación.
Para analizar la relación entre variables se utilizan los llamados «coeficientes de
correlación». Se realizan sobre sobre variables cuantitativas o cualitativas, Esta técnica
cuenta con una gran variedad de fuentes de información y a su vez abierta para que se
pueda realizar análisis propios, al ser una herramienta amplia se usa en diversas áreas e
investigaciones de todo tipo. En el proceso de la correlación se puede por ejemplo hacer
uso de una relación de tipo lineal en búsqueda de reducir riesgo hacia el error, para que
esto sea posible es necesario conocer los datos lo que permitirá determinar que
coeficientes se usaran y que sean los más adecuados de acuerdo a las necesidades de la
compañía, se deben definir como mínimo dos variables, clarificar los campos de una base
de datos y similares.
7. Importancia de la calidad de los datos dentro de la organización.

La calidad de datos es un concepto muy amplio que podríamos resumir como el conjunto
de procesos, operaciones, técnicas y algoritmos; que mantiene la información de las
empresas, de las organizaciones, de una forma completa, precisa, consistente, actualizada,
única y sobre todo, válida para ser utilizada con fiabilidad en todos los estudios analíticos
y, principalmente, en la toma de decisiones.
En definitiva, nos va a permitir gestionar la información y ponerla a disposición con
fiabilidad en la toma de decisiones. Y si queremos destacar una característica sobre todas,
en mi opinión, es la confianza que aporta a las acciones realizadas.

Cuando se tiene presente que los beneficios que trae la calidad de la información
aumentan y potencializan el valor de sus negocios llevándolos hacia la innovación y ser
más competitivos. Se deberán fijar estándares de calidad, actuales y asertivos, que
cuenten con disponibilidad para ser usados siendo claro confiables y contar con calidad
8. Importancia del procesamiento de los datos como generador de información
dentro de la organización.

Procesos generadores de datos es ofrecer bastante información sobre las características de


la serie de tiempo sujeta a modelamiento, y no sólo de los valores que ésta tendrá en el
futuro, sino de la media de largo plazo, de su varianza o la varianza de los errores.

Visualizar la importancia de aprender a procesar los datos convertirlos en información y


luego con ella entrar a competir en un mercado que cada día se transforma y os exige
mucho más, en entornos no solo de ventas o mercadeo, sino en los diferentes campos en
lo intelectual, el crecimiento de las organizaciones y los diferentes indicadores que define
una compañía cuyo objetivo es ser cada día más competitiva y alcanzar un crecimiento

También podría gustarte