Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura:
Gestión De La Calidad De La Información
Actividad No 3
Etapa 3_Transferencia
Presenta
Kevin Pachón Fajardo
Jeisson A. Lineros
Guillermo Parra Castro
Técnica Profesional En Operación Y Mantenimiento De Bases De Datos
Docente
Huego Javier Mantilla Gómez
Contenido
Contextualización ....................................................................................................................... 3
Actividad .................................................................................................................................... 4
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la organización. ......... 5
2. Métodos de estimación de la dimensionalidad de los datos al interior de la empresa . 6
3. Importancia los procesos de reducción de la dimensión de los datos dentro de la
organización. ............................................................................................................................... 7
4. Algoritmos locales de reducción de dimensiones de los datos dentro de la organización.
8
5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos dentro
de los sistemas de información y su impacto en la empresa. ...................................................... 9
6. Importancia de la correlación de las dimensiones dentro del análisis de los datos de la
organización. ............................................................................................................................. 11
7. Importancia de la calidad de los datos dentro de la organización. ............................. 11
8. Importancia del procesamiento de los datos como generador de información dentro de
la organización. ......................................................................................................................... 12
Conclusiones ............................................................................................................................ 13
Referencias ............................................................................................................................... 14
3
Contextualización
Actividad
Los datos son el activo más valioso de una organización, adicional hay unos estándares de
calidad de datos basados no solo en las propias dimensiones de la calidad si no que al compartirlos
con quien los necesite, su estructura básicamente es como su nombre lo indica una estructura que
puede ser física o digital la cual nos permite realizar diferentes procesos como son editar, guardar
actualizar entre otros esto cumplen una función muy importante en las empresas ya que a diario se
da manejo a cualquier información de cualquier tipo.
Estos datos deben cumplir con su estándar de calidad Para ello, es básico realizar una auditoría
inicial o perfilamiento de los datos, con el objetivo de averiguar en qué estado se encuentran éstos
y a partir de ahí, detectar qué se debe corregir y a su vez determinar parámetros de control que
ayuden a medir el avance en los procesos de calidad.
Estos parámetros son conocidos como las seis dimensiones de calidad de datos y son
consideradas como los puntos clave que debe de cubrir la calidad de los datos para asegurar
nuestros procesos de limpieza y calidad.
Conformidad.
Consistencia.
Precisión / Exactitud.
Duplicación.
Integridad.
6
Puede ser que tengamos variables redundantes en nuestro conjunto que tuvieran una correlación
entre ellas suficientemente fuerte como para que no merezca la pena tener las dos. Por
ejemplo, siguiendo con nuestro ejemplo de predicción de cáncer, quizá teniendo la variable de
capacidad pulmonar, no merece la pena tener también la variable que indica si es fumador o no, ya
que puede que esta última esté, de una forma u otra, ya recogida en la primera. Existe
software, gratis por cierto, como WEKA, que con un par de clics te dice con qué variables se
quedaría y con cuáles no. Tan solo hay que cargarle la colección de datos, contarle qué criterios y
estrategias quieres llevar a cabo, y darle a un botón mágico.
No tarda nada, por lo que puedes probar distintas configuraciones e incluso ver que tal rinde un
modelo de aprendizaje con la nueva colección reducida de datos y comparar.
9
Para llevar esa tarea se deben tener presentes algo que se denomina coeficientes de
correlación y en lo que intervienen las variables cualitativas y cuantitativas. Esta técnica
cuenta con una gran variedad de fuentes de información y a su vez abierta para que se pueda
realizar análisis propios, al ser una herramienta amplia se usa en diversas áreas e
investigaciones de todo tipo. En el proceso de la correlación se puede por ejemplo hacer uso
de una relación de tipo lineal en búsqueda de reducir riesgo hacia el error, para que esto sea
posible es necesario conocer los datos lo que permitirá determinar que coeficientes se usaran
y que sean los más adecuados de acuerdo a las necesidades de la compañía, se deben definir
como mínimo dos variables, clarificar los campos de una base de datos y similares.
Teniendo en cuenta que la información como ese conjunto de datos son un pilar invaluable
en cualquier empresa, ya que permite una adecuada y en gran medida optima toma de
decisiones es allí donde encontramos una serie de técnicas y procedimientos para proteger,
optimizar, actualizar y verás de la misma. Cuando se tiene establecido una serie de pasos y
se siguen esos lineamientos en la compañía podremos hacer uso de los mismo en la
correcta toma de decisiones.
12
Los datos como esa materia prima, solos no transmite mayor valor es allí donde se hace
necesario que se conviertan en información o en otras palabras que sean datos procesados,
propicios para la toma de decisiones, para que lo anterior se logre se debe tener presente el
conocimiento acompañado de la experiencia y finalmente llegar a la acción o toma de
decisiones basados en todo el proceso anterior.
Cuando se tiene presente que los beneficios que trae la calidad de la información aumentan
y potencializan el valor de sus negocios llevándolos hacia la innovación y ser más
competitivos. Se deberán fijar estándares de calidad, actuales y asertivos, que cuenten con
disponibilidad para ser usados siendo claro confiables y contar con calidad.
En este orden de ideas las herramientas que se podría considerar útiles como diagramas, flujos,
estadísticas, entre otros, pero al igual de importantes en el campo de la toma de decisiones.
Conclusiones
Siempre se deben tener en cuenta que cualquier tipo de dato debe cumplir ciertas
métricas que ayuden a que la información se confiable para la compañía.
La importancia de la información dentro una compañía debe tener siempre equilibrio
con los estándares de la información para las compañías.
La integridad de los datos dentro de una compañía son fundamentales para la toma de
decisiones clave a fututo en una compañía.
14
Referencias
https://virtual.ucompensar.edu.co/mod/scorm/view.php?id=1007192
https://formacionesucompensar.co/dev_content/facultades/facing/ing_sistemas/gc_info
rmacion/assets/transferencia.pdf
https://www.incibe.es/sites/default/files/contenidos/dosieres/metad_proteccion-de-la-
informacion.pdf
https://www.revistaespacios.com/a17v38n34/a17v38n34p17.pdf
https://aprendeia.com/reduccion-de-la-dimensionalidad-machine-learning/
https://es.wikipedia.org/wiki/Reducci%C3%B3n_de_dimensionalidad