Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FUENTES DE INFORMACIÓN
1
Las fuentes de información se definen como un instrumento o recurso, que permite
satisfacer una necesidad informativa. Su objetivo es facilitar la localización e
identificación de la información. Y se debe considerar que el tipo de fuente de
información proporcione un nivel adecuado a las necesidades para lo que se requiera.
Figura 1
Figura 2:
3. Fuentes Terciarias. Son recursos que contienen información breve sobre las
fuentes secundarias y remiten a ellas como fuentes de referencias (ver figura
3):
a. Bibliografía de bibliografías
b. Guías de obra de referencias
c. Índices
d. Catálogos
e. Directorios, guías
Figura 3:
3
Fuentes de Información Terciarias
Fuentes Primarias
Datos primarios: son los datos que genera el investigador para alcanzar los objetivos
del proyecto en que se está trabajando (ver figura 4).
Figura 4:
Datos primarios
Fuentes de Información
• Observación
• Experimentación
• Simulación
• Entrevista
Fuentes Secundarios
Figura 5:
Datos secundarios
• Revisión de bibliografía
• Recopilación de datos
• Resúmenes
Fuentes Terciarios
Datos terciarios: son todos aquellos que han sido recopilados con anterioridad, para
fines iguales, similares o diferentes a los de la investigación o proyecto (ver figura
6).
Fuentes de Información
• Búsqueda en Internet
Figura 6:
Datos terciarios
Importancia de la información
Una fuente solo es valiosa si aporta información útil y pertinente en vinculación con
lo que se esté investigando.
5
Una fuente de información es confiable cuando los datos se ajustan a estas variables:
Data Warehouse
Una vez preparada y almacenada la información en el DW, esta se puede utilizar para
los servicios que se observan a la derecha de la figura 7, por ejemplo, reportería,
visualización de datos (dashboard tableros de control), minería de datos, realizar
predicciones, entre otros servicios.
Figura 7:
Funcionalidades del DW
Estos fundamentos permiten que un DW pueda adaptarse a los cambios como sea
posible. La información en el mundo real es muy volátil, y el DW debe estar preparado
para recibir estos cambios.
Figura 8:
La naturaleza del DW debe ser multipropósito. Sus datos deben estar en un formato
que soporte cualquiera y todas las formas posibles de análisis.
9
¿Cuál es la diferencia entre un DW y una base de datos convencional?
Las bases de datos tradicionales, utilizadas por sistemas transaccionales con relación
a un DW, son polos opuestos en cuanto a sus requerimientos de operación y diseño.
https://cran.r-project.org/bin/windows/base/
La descarga de R es gratuita.
https://www.rstudio.com/products/rstudio/download/
10
• Modalidad: diurno/vespertino
• Edad: de 20 a 49 según muestra
• Semestre: 3, 4, 5, 6, 7 y 8 del programa en cuestión
• Evaluación Pregunta 1
• Evaluación Pregunta 2
• Evaluación Rotular
• Evaluación Reducción de Contenido
• Evaluación Título
Fuentes de Información
• Abstracción:
• Abstracción Mala: 1<= Promedio valores de entrada <2
• Abstracción Satisfactoria: 2<= Promedio valores de entrada <3
• Abstracción Buena: 3<= Promedio valores de entrada <3,5
• Abstracción Óptima: 3,5<= Promedio valores de entrada <4
𝑁𝑜 𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛, 1 ≤ 𝑋̅ < 2
𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑆𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑡𝑜𝑟𝑖𝑎, 2 ≤ 𝑋̅ < 3
𝑋̅ =
𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 𝐵𝑢𝑒𝑛𝑎, 3 ≤ 𝑋̅ < 3,5
{ 𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 Ó𝑝𝑡𝑖𝑚𝑎, 3,5 ≤ 𝑋̅ ≤4
library(readxl)
11
library(dplyr)
library(ggplot2)
library(ggcorrplot)
library(e1071)
library(ROCR)
library(class)
library(rpart)
library(randomForest)
library(reshape)
library(kknn)
Fuentes de Información
Recuerde revisar bien la ruta de su archivo, pues este puede cambiar dependiendo
de la carpeta donde guarde la información. La ruta la puede recuperar haciendo clic
izquierdo en el archivo y revisando las propiedades del archivo. En el recuadro que
salga puede copiar la ruta y pegarla en el código fuente de su aplicación.
Cuando realice la copia, la ruta estará compuesta por este separador de carpeta: "\".
R no reconoce este separador, por lo que hay que cambiarlos todos por el siguiente
separador: "/". Ejemplo: "C:\Documentos\BBDD\nombre_archivo.xlsx" debe ser
cambiado a "C:/Documentos/BBDD/nombre_archivo.xlsx"
str(data)
`Titulo`="Titulo",`PromedioPreguntas`="PromedioPreguntas"))
abs<-select(data,2:9)
Para ajustar el modelo lo primero que tenemos que hacer es una correlación. Esto no
es de utilidad para saber el comportamiento de las variables de la base de datos. Lo
ideal es que todas las variables estén correlacionadas. Esto significa que los valores
de correlación sean uno o estén cercanos a uno. Si son cercanas a cero, implica que
las variables no se influyen unas con otras.
Correlaciones
cor(abs)%>%round(2)
Fuentes de Información
Normalización
La normalización de las variables significa quitar las escalas y dejar que todas sean
iguales. La función deja las escalas de 0 a 1 para todas las variables. Para realizar el
análisis de componentes principales siempre es requisito normalizar y, además, solo
se pueden considerar variables numéricas
Figura 9:
14
Proceso de Rotación
Fuentes de Información
acp<-prcomp(abs_norm)
acp
Figura 10:
15
Los componentes que arroja el cálculo deben ser igual al número de registros de la
base de datos. Y los valores se calculan midiendo la distancia del origen a cada uno
de los puntos (ver figura 3), y esa distancia es el valor de los componentes.
Fuentes de Información
Figura 11:
Cálculo de la estimación de cada uno de los datos para los componentes principales
Lo que busca el modelo es captar la mayor variabilidad de los datos y hacer una
reducción de los mismos. Y para ello capta la varianza.
acp$x
16
Resultados e Interpretación
Para ver cuál es el resultado de cada una de las componentes se puede utilizar el
gráfico de sedimentación. El gráfico de sedimentación de la varianza nos entrega
como resultado el nivel de explicación que tiene cada componente respecto a la
varianza.
screeplot(acp,type="lines")
Con los componentes principales elegidos (los primeros que mejor expliquen la
varianza) se vuelve a realizar una correlación con las variables originales.
cp<-data.frame(acp$x)
cp<-cp[,1:3]
Fuentes de Información
Las correlaciones nos dirán qué variables corresponden a un perfil o a otro perfil. Así
se podrán identificar los perfiles (dados por los componentes principales), y se podrá
establecer una hipótesis de por qué tienen este comportamiento.
Bibliografía:
Foster P.& Fawcett, T. (2013). Data Science for Business: What you need to know
about data mining and data-analytic thinking,1 edition. O'Reilly Media.
17