Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONTENIDO
Resumen…............................................................................................................ 3
Actividad............................................................................................................... 4
1. Conceptos de datos, su estructura, sus dimensiones, dentro de la
organización…………………………………………………………….............. 5
2. Métodos de estimación de la dimensionalidad de los datos al interior de la
empresa ..……………………………………………………….......................... 6
3. Importancia los procesos de reducción de la dimensión de los datos dentro de la
organización.......................................................................................................... 7
4. Algoritmos locales de reducción de dimensiones de los datos dentro de la
organización…………………………………………………………………...... 8
5. Interpreta los métodos globales de reducción de la dimensionalidad de los datos
dentro
de los sistemas de información y su impacto en la
empresa................................................................................................................. 9
6. Importancia de la correlación de las dimensiones dentro del análisis de los datos
de la
organización........................................................................................................ 10
7. Importancia de la calidad de los datos dentro de la
organización…………….................................................................................... 11
8. Importancia del procesamiento de los datos como generador de información
dentro de organización........................................................................................ 12
Referencias.......................................................................................................... 14
RESUMEN
Los datos son muy importantes en una organización porque es una colección completa de
prácticas, conceptos, procedimientos, procesos y una amplia gama de sistemas
complementarios que permiten a una organización obtener el control de sus recursos de
datos.
La gestión de datos como práctica general está relacionada con el ciclo de vida completo
de un activo de datos desde su punto de creación original hasta su retiro final.
Es decir, desde cómo avanza y cambia a lo largo de su vida útil a través de los flujos de
datos internos y externos de una empresa. Hay unos estándares de calidad de datos basados
no solo en las propias dimensiones de la calidad si no que al compartirlos con quien los
necesite, su estructura básicamente es como su nombre lo indica una estructura que puede
ser física o digital la cual nos permite realizar diferentes procesos como son editar, guardar
actualizar entre otros esto cumplen una función muy importante en las empresas ya que a
diario se da manejo a cualquier información de cualquier tipo.
Estos datos deben cumplir con su estándar de calidad Para ello, es básico realizar una
auditoría inicial o perfilamiento de los datos, con el objetivo de averiguar en qué estado se
encuentran éstos y a partir de ahí, detectar qué se debe corregir y a su vez determinar
parámetros de control que ayuden a medir el avance en los procesos de calidad. Estos
parámetros son conocidos como las seis dimensiones de calidad de datos y son
consideradas como los puntos clave que debe de cubrir la calidad de los datos para asegurar
nuestros procesos de limpieza y calidad.
2. Métodos de estimación de la dimensionalidad de los datos al interior de la
empresa
Estos son algunos de los tipos de análisis de datos que puedes implementar para la
correcta toma de decisiones empresariales:
3. Importancia los procesos de reducción de la dimensión de los datos dentro de
la organización
ERP como parte importante de la arquitectura del impacto que generan los proyectos
tecnológicos en las organizaciones, Una de las técnicas de pre procesado para modelos de
aprendizaje supervisado es la reducción de la dimensionalidad, que no es más que la
reducción del número de variables en una colección de datos y tiene como ventaja lo
siguiente
Selección de variables
Un conjunto de variables óptimo para un conjunto de datos será el que contiene las
variables más significativas del conjunto de datos original. Para seleccionar las
variables se siguen diferentes criterios.
En la práctica, la matriz de correlación de los datos se construye y en esta matriz se
calcula los auto vectores. Los vectores propios que corresponden a los valores
propios más grandes se pueden utilizar ahora para reconstruir una gran fracción de la
varianza de los datos originales. La técnica resultante es capaz de construir
asignaciones no lineales que maximizan la varianza en los datos.
Una técnica de reducción de dimensionalidad que se utiliza a veces en neurociencia es las
dimensiones informativas al máximo, que encuentra una representación de menor
dimensión de un conjunto de datos de tal manera que tanto información mutua como sea
posible sobre el original los datos se conservan.
Es una técnica de análisis de información con base estadística y, por ende, matemática.
Consiste en analizar la relación entre, al menos, dos variables - p.e. dos campos de una
base de datos o de un log o raw data-. El resultado debe mostrar la fuerza y el sentido de
la relación.
Para analizar la relación entre variables se utilizan los llamados «coeficientes de
correlación». Se realizan sobre sobre variables cuantitativas o cualitativas, Esta técnica
cuenta con una gran variedad de fuentes de información y a su vez abierta para que se
pueda realizar análisis propios, al ser una herramienta amplia se usa en diversas áreas e
investigaciones de todo tipo. En el proceso de la correlación se puede por ejemplo hacer
uso de una relación de tipo lineal en búsqueda de reducir riesgo hacia el error, para que
esto sea posible es necesario conocer los datos lo que permitirá determinar que
coeficientes se usaran y que sean los más adecuados de acuerdo a las necesidades de la
compañía, se deben definir como mínimo dos variables, clarificar los campos de una base
de datos y similares.
7. Importancia de la calidad de los datos dentro de la organización.
La calidad de datos es un concepto muy amplio que podríamos resumir como el conjunto
de procesos, operaciones, técnicas y algoritmos; que mantiene la información de las
empresas, de las organizaciones, de una forma completa, precisa, consistente, actualizada,
única y sobre todo, válida para ser utilizada con fiabilidad en todos los estudios analíticos
y, principalmente, en la toma de decisiones.
En definitiva, nos va a permitir gestionar la información y ponerla a disposición con
fiabilidad en la toma de decisiones. Y si queremos destacar una característica sobre todas,
en mi opinión, es la confianza que aporta a las acciones realizadas.
Cuando se tiene presente que los beneficios que trae la calidad de la información
aumentan y potencializan el valor de sus negocios llevándolos hacia la innovación y ser
más competitivos. Se deberán fijar estándares de calidad, actuales y asertivos, que
cuenten con disponibilidad para ser usados siendo claro confiables y contar con calidad
8. Importancia del procesamiento de los datos como generador de información
dentro de la organización.