Está en la página 1de 14

1

Asignatura:
Gestión De La Calidad De La Información

Actividad No 3
Etapa 3_Transferencia

Presenta
Kevin Pachón Fajardo
Jeisson A. Lineros
Guillermo Parra Castro
Técnica Profesional En Operación Y Mantenimiento De Bases De Datos

Docente
Huego Javier Mantilla Gómez

Bogotá DC Colombia 19 De Marzo Del 2022


2

Contenido
Contextualización ....................................................................................................................... 3
Actividad .................................................................................................................................... 4
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la organización. ......... 5
2. Métodos de estimación de la dimensionalidad de los datos al interior de la empresa . 6
3. Importancia los procesos de reducción de la dimensión de los datos dentro de la
organización. ............................................................................................................................... 7
4. Algoritmos locales de reducción de dimensiones de los datos dentro de la organización.
8
5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos dentro
de los sistemas de información y su impacto en la empresa. ...................................................... 9
6. Importancia de la correlación de las dimensiones dentro del análisis de los datos de la
organización. ............................................................................................................................. 11
7. Importancia de la calidad de los datos dentro de la organización. ............................. 11
8. Importancia del procesamiento de los datos como generador de información dentro de
la organización. ......................................................................................................................... 12
Conclusiones ............................................................................................................................ 13
Referencias ............................................................................................................................... 14
3

Contextualización

En un mundo centrado en la generación y procesamiento de datos es de gran importancia


desarrollar un gran diferencial frente a los demás competidores en el sector empresarial. El
conocimiento más una acción, es lo que llamo una ventaja competitiva; y explotar los datos para
generar el conocimiento es lo que se debe hacer para apoyar a las empresas en tres perspectivas:
la Ciber seguridad, la gestión y Monitorización de la infraestructura tecnológica y en la Inteligencia
de negocio.
Sin embargo, las empresas apenas empiezan a comprender el valor de los DATOS. La
transformación de varios sectores como el de transporte y el turístico, en empresas como Uber o
AirBnB, hace que las compañías comiencen a entender cuál es el valor en el manejo de
información sensible y confidencial a través de plataformas digitales. Aunque queda mucho
camino por recorrer, ya se habla de que el valor de una empresa se mide, también, por los datos
que maneja.
Lo que sí es cierto es que el 79% de las empresas afirman que el análisis de datos mejora la
toma de decisiones, según información arrojada por el Centro de Seguridad y Vigilancia Digital
(CSVD) de la compañía A3Sec. Asimismo las innovaciones de Big Data aplicadas en los sectores
financieros y salud, como, por ejemplo, el desarrollo de herramientas de automatización de tareas
que ayudan a reaccionar de forma rápida, eficaz y oportuna han permitido identificar
oportunidades y riesgos basados en los datos de la compañía.
4

Actividad

Usted ha sido contratado como director de calidad de la información en una compañía


internacional que ha venido teniendo problemas con sus clientes en los últimos meses. Es por esto
por lo que le han solicitado generar un plan de acción para implementar un proyecto de calidad de
datos. La solución a estos problemas pasa por implementar procesos de calidad adaptados a las
necesidades de la empresa, basados en el control del ciclo de vida de la calidad de los datos
mediante un perfilado de la estructura y el contenido y una limpieza. Por lo general, los pasos se
dividen en distintas acciones, que se llevan a cabo siguiendo el orden lógico: descubrir,
analizar/definir, desarrollar, revisar/analizar y monitorizar. Idealmente, además, la solución ha de
ser global, no departamental, si no desde un principio, al menos, sí a largo plazo.
Además de implementar un proyecto de calidad de datos, transformar pérdidas en beneficios
requiere contar con recursos humanos idóneos, tecnologías de vanguardia.
En esta tercera etapa se solicita generar en los equipos el siguiente documento en el que deberán
consultar y articular un documento que resuma:
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la organización.
2. Métodos de estimación de la dimensionalidad de los datos al interior de la empresa
3. Importancia los procesos de reducción de la dimensión de los datos dentro de la
organización.
4. Algoritmos locales de reducción de dimensiones de los datos dentro de la organización.
5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos dentro de
los sistemas de información y su impacto en la empresa.
6. Importancia de la correlación de las dimensiones dentro del análisis de los datos de la
organización.
7. Importancia de la calidad de los datos dentro de la organización
8. Importancia del procesamiento de los datos como generador de información dentro de la
organización.
5

1. Conceptos de datos, su estructura, sus dimensiones, dentro de la organización.

Los datos son el activo más valioso de una organización, adicional hay unos estándares de
calidad de datos basados no solo en las propias dimensiones de la calidad si no que al compartirlos
con quien los necesite, su estructura básicamente es como su nombre lo indica una estructura que
puede ser física o digital la cual nos permite realizar diferentes procesos como son editar, guardar
actualizar entre otros esto cumplen una función muy importante en las empresas ya que a diario se
da manejo a cualquier información de cualquier tipo.
Estos datos deben cumplir con su estándar de calidad Para ello, es básico realizar una auditoría
inicial o perfilamiento de los datos, con el objetivo de averiguar en qué estado se encuentran éstos
y a partir de ahí, detectar qué se debe corregir y a su vez determinar parámetros de control que
ayuden a medir el avance en los procesos de calidad.
Estos parámetros son conocidos como las seis dimensiones de calidad de datos y son
consideradas como los puntos clave que debe de cubrir la calidad de los datos para asegurar
nuestros procesos de limpieza y calidad.
 Conformidad.
 Consistencia.
 Precisión / Exactitud.
 Duplicación.
 Integridad.
6

2. Métodos de estimación de la dimensionalidad de los datos al interior de la empresa

En las organizaciones siempre suelen existir actividades referentes a la planificación a


medio/largo plazo, con el objetivo de planificar lo que queremos conseguir y de qué manera vamos
a actuar para su consecución.
A este tipo de procesos que engloban este tipo de actividades podemos denominarlos procesos
estratégicos, y nos podemos encontrar algunos como: proceso de revisión del sistema de gestión,
proceso de establecimiento de políticas, proceso de establecimiento de objetivos, etc., es decir,
todos aquellos procesos que incluyan las actividades
Uno de los más importante son los procesos de medición ya que nos van a dar información de
cómo se están desarrollando el resto de los procesos de la empresa. Aquí podemos encontrar
procesos de auditoría interna, proceso de análisis de datos, proceso de inspección y control,
proceso de satisfacción del cliente a continuación informo los tipos de datos que se deben realizar
en una empresa.
 Análisis descriptivo.
 Análisis diagnóstico.
 Análisis predictivo.
 Análisis prescriptivo.
 Análisis cognitivo.
7

3. Importancia los procesos de reducción de la dimensión de los datos dentro de la


organización.

Entre los principales resultados en las dimensiones organizacionales se puede observar la


Planificación de Recursos de Material que permitían reducir los niveles de considerando a los
sistemas ERP como parte importante de la arquitectura del impacto que generan los proyectos
tecnológicos en las organizaciones, Una de las técnicas de pre procesado para modelos de
aprendizaje supervisado es la reducción de la dimensionalidad, que no es más que la reducción del
número de variables en una colección de datos y tiene como ventaja lo siguiente.
 Reduce el espacio de tiempo y almacenamiento requerido.
 La eliminación de multicolinealidad mejora el rendimiento del modelo de aprendizaje
automático.
 Se hace más fácil de visualizar los datos cuando se reduce a dimensiones muy bajas tales
como 2D o 3D.
8

4. Algoritmos locales de reducción de dimensiones de los datos dentro de la


organización.
Considera este escenario en que necesitas muchas variables de indicadores en el conjunto de
datos para alcanzar un resultado más preciso del modelo de Machine Learning, luego tiende a
agregar tantas características como sea posible al principio. Este fenómeno se conoce como «la
maldición de la dimensionalidad». La maldición de la dimensionalidad ocurre porque la densidad
de la muestra disminuye exponencialmente con el aumento de la dimensionalidad. Cuando
seguimos añadiendo características sin aumentar el número de muestras de entrenamiento, la
dimensionalidad del espacio de características crece y se vuelve más y más dispersa.

Aquí es donde las técnicas de reducción de la dimensionalidad vienen a rescatarte. La ventaja de


la eliminación de características es que es fácil de implementar y hace que nuestro conjunto de
datos sea pequeño, incluyendo solo las variables en las que estamos interesados. Pero como
desventaja, podríamos perder algo de información de las variables que dejamos de
evaluar. Digamos que tienes 29 variables en un conjunto de datos, entonces la técnica de extracción
de características creará 29 nuevas variables que son combinaciones de 29 variables antiguas.
Un conjunto de variables óptimo para un conjunto de datos será el que contiene las variables
más significativas del conjunto de datos original. Para seleccionar las variables se siguen diferentes
criterios. Ya bien sea por conocimiento en el campo o por lógica, podemos intuir cuáles son las
variables más significativas. Pero no siempre podemos estar seguros de que el color de los ojos no
influye en la probabilidad de padecer cáncer o quizá no queramos arriesgar a hacer tal afirmación.

Puede ser que tengamos variables redundantes en nuestro conjunto que tuvieran una correlación
entre ellas suficientemente fuerte como para que no merezca la pena tener las dos. Por
ejemplo, siguiendo con nuestro ejemplo de predicción de cáncer, quizá teniendo la variable de
capacidad pulmonar, no merece la pena tener también la variable que indica si es fumador o no, ya
que puede que esta última esté, de una forma u otra, ya recogida en la primera. Existe
software, gratis por cierto, como WEKA, que con un par de clics te dice con qué variables se
quedaría y con cuáles no. Tan solo hay que cargarle la colección de datos, contarle qué criterios y
estrategias quieres llevar a cabo, y darle a un botón mágico.

No tarda nada, por lo que puedes probar distintas configuraciones e incluso ver que tal rinde un
modelo de aprendizaje con la nueva colección reducida de datos y comparar.
9

5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos


dentro de los sistemas de información y su impacto en la empresa.
La extracción de características transforma los datos en la alta dimensión espacio para un
espacio de menor dimensión. La transformación de datos puede ser lineal, como en análisis
de componentes principales, pero también existen muchas técnicas de reducción de
dimensionalidad no lineal. 34 Para los datos multidimensionales, tensoriales la
representación puede ser utilizado en la reducción de dimensionalidad a través del
aprendizaje de subespacio multilineal. La técnica lineal principal para la reducción de
dimensionalidad, análisis de componentes principales, realiza un mapeo lineal de los datos
a un espacio inferior-dimensional de tal manera que la varianza de los datos en la
representación de pocas dimensiones se maximiza.

En la práctica, la matriz de correlación de los datos se construye y en esta matriz se calcula


los autovectores. Los vectores propios que corresponden a los valores propios más grandes
se pueden utilizar ahora para reconstruir una gran fracción de la varianza de los datos
originales. La técnica resultante es capaz de construir asignaciones no lineales que
maximizan la varianza en los datos. Estas técnicas construyen una representación de datos
de pocas dimensiones utilizando una función de coste que conserva las propiedades locales
de los datos, y se puede ver como la definición de un núcleo basado en el gráfico de Kernel
PCA.
10

Una técnica de reducción de dimensionalidad que se utiliza a veces en neurociencia es las


dimensiones informativas al máximo, que encuentra una representación de menor
dimensión de un conjunto de datos de tal manera que tanto información mutua como sea
posible sobre el original los datos se conserva.
11

6. Importancia de la correlación de las dimensiones dentro del análisis de los datos de


la organización.
Si partimos de la base en la que la esencia de la correlación como aquella herramienta de
gran valor en el proceso del análisis de datos, podemos definirla como una técnica que hace
uso de la estadística que se acompaña de las matemáticas, partiendo como mínimo de dos
variables, cuyo propósito debe ser mostrar el sentido y la fuerza de la relación.

Para llevar esa tarea se deben tener presentes algo que se denomina coeficientes de
correlación y en lo que intervienen las variables cualitativas y cuantitativas. Esta técnica
cuenta con una gran variedad de fuentes de información y a su vez abierta para que se pueda
realizar análisis propios, al ser una herramienta amplia se usa en diversas áreas e
investigaciones de todo tipo. En el proceso de la correlación se puede por ejemplo hacer uso
de una relación de tipo lineal en búsqueda de reducir riesgo hacia el error, para que esto sea
posible es necesario conocer los datos lo que permitirá determinar que coeficientes se usaran
y que sean los más adecuados de acuerdo a las necesidades de la compañía, se deben definir
como mínimo dos variables, clarificar los campos de una base de datos y similares.

7. Importancia de la calidad de los datos dentro de la organización.

Teniendo en cuenta que la información como ese conjunto de datos son un pilar invaluable
en cualquier empresa, ya que permite una adecuada y en gran medida optima toma de
decisiones es allí donde encontramos una serie de técnicas y procedimientos para proteger,
optimizar, actualizar y verás de la misma. Cuando se tiene establecido una serie de pasos y
se siguen esos lineamientos en la compañía podremos hacer uso de los mismo en la
correcta toma de decisiones.
12

Los datos como esa materia prima, solos no transmite mayor valor es allí donde se hace
necesario que se conviertan en información o en otras palabras que sean datos procesados,
propicios para la toma de decisiones, para que lo anterior se logre se debe tener presente el
conocimiento acompañado de la experiencia y finalmente llegar a la acción o toma de
decisiones basados en todo el proceso anterior.
Cuando se tiene presente que los beneficios que trae la calidad de la información aumentan
y potencializan el valor de sus negocios llevándolos hacia la innovación y ser más
competitivos. Se deberán fijar estándares de calidad, actuales y asertivos, que cuenten con
disponibilidad para ser usados siendo claro confiables y contar con calidad.

8. Importancia del procesamiento de los datos como generador de información dentro


de la organización.

El procesamiento de los datos juega un papel fundamental al permite dimensionar de una


manera más amplia y con el uso de la analítica de los datos. Es importante tener en cuenta
costo beneficio de esa forma determinar los recursos necesarios para la información y lo que
se requiera. Hacer uso de herramientas, que optimicen y den utilidad en el análisis de datos. Si
no se alcanza como propósito una información apropiada se verá afectada en gran manera esa
toma de decisiones sobre las diferentes compañías.

En este orden de ideas las herramientas que se podría considerar útiles como diagramas, flujos,
estadísticas, entre otros, pero al igual de importantes en el campo de la toma de decisiones.

Si nos detenemos un momento a analizar un mundo globalizado, tecnificado podemos visualizar


la importancia de aprender a procesar los datos convertirlos en información y luego con ella
entrar a competir en un mercado que cada día se transforma y os exige mucho más, en entornos
no solo de ventas o mercadeo, sino en los diferentes campos en lo intelectual, el crecimiento de
las organizaciones y los diferentes indicadores que define una compañía cuyo objetivo es ser
cada día más competitiva y alcanzar un crecimiento.
13

Conclusiones

 Siempre se deben tener en cuenta que cualquier tipo de dato debe cumplir ciertas
métricas que ayuden a que la información se confiable para la compañía.
 La importancia de la información dentro una compañía debe tener siempre equilibrio
con los estándares de la información para las compañías.
 La integridad de los datos dentro de una compañía son fundamentales para la toma de
decisiones clave a fututo en una compañía.
14

Referencias
 https://virtual.ucompensar.edu.co/mod/scorm/view.php?id=1007192
 https://formacionesucompensar.co/dev_content/facultades/facing/ing_sistemas/gc_info
rmacion/assets/transferencia.pdf
 https://www.incibe.es/sites/default/files/contenidos/dosieres/metad_proteccion-de-la-
informacion.pdf
 https://www.revistaespacios.com/a17v38n34/a17v38n34p17.pdf
 https://aprendeia.com/reduccion-de-la-dimensionalidad-machine-learning/
 https://es.wikipedia.org/wiki/Reducci%C3%B3n_de_dimensionalidad

También podría gustarte