Está en la página 1de 109

Código: F-GP-06-01

GESTIÓN DE LOS PROGRAMAS


Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 1 de 109

DOCUMENTO CONTROLADO

MAESTRIA EN ESTADISTICA
APLICADA Y CIENCIA DE DATOS

Syllabus
Área básica
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 2 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en Estadística aplicada y Ciencia de datos
Introducción a la estadística y probabilidad
Nombre de la Asignatura
Cuatrim
Código de la Asignatura 1 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica X Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 6 10 sincrónicas /periodo 80
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Stalyn
Guerrero sguerrerog@unbosque.edu.co

Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 3 de 109

DOCUMENTO CONTROLADO

El estudiante de la Maestría en Estadística Aplicada y ciencia de datos tendrá que tomar de forma permanente
decisiones basadas en los datos, por lo cual, es necesario que desarrollé la capacidad de procesar y analizar la
información proveniente de diferentes fuentes para realizar los diferentes cálculos de estadística descriptivas
(media, varianza, cuantiles, histogramas, entre otras). Por lo tanto, debe contar con destreza para desarrollar e
implementar scripts de procesamiento de datos en forma autónoma. De igual forma, el estudiante debe
comprender conceptos básicos de la probabilidad Estadística y la Inferencia como son las distribuciones de
probabilidad, intervalos de confianza y pruebas de hipótesis.

2. Contenidos Generales

1. Introducción a R, Rstudio y el lenguaje de programación.


2. Estadística descriptiva.
a. Medidas de tendencia central
b. Medidas de dispersión
c. Tablas de frecuencias e histogramas
d. Prácticas en R
3. Introducción a la probabilidad
a. Distribución de probabilidad
b. Cálculo de probabilidad distribuciones discretas.
c. Cálculo de probabilidad distribuciones continuas.
d. Prácticas en R
4. Inferencia estadística.
a. Distribuciones muéstrales
b. Definición de estimador, métodos de estimación e Intervalos de confianza
c. Métodos de remuestreo
d. Pruebas de hipótesis
e. Análisis de varianza
5. Manejo de bases de datos con R.
a. Librería tidyverse.
b. Funciones para el resumen de datos.
c. Funciones para la agrupación de datos.
d. Visualización de datos con ggplot2
e. Manipulación de datos a partir de listas.
6. Reportes dinámicos con R.
a. Rmarkdown
b. Shiny
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 4 de 109

DOCUMENTO CONTROLADO

3. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes de la maestría estarán en capacidad de identificar y comprender los
conceptos de la estadística descriptiva, la probabilidad y la inferencia estadística por
Conocimiento medio del software R; podrán realizar y comprender el procesamiento de información
fundamental y representación de datos, aplicar y calcular las diferentes medidas de posición,
dispersión, realizar inferencias por medio de intervalos de confianza y pruebas de
hipótesis.

Los estudiantes representarán información cuantitativa y cualitativa mediante gráficos


y cálculos estadísticos; así como serán capaces de evaluar tendencias a partir de
información estadística dada y realizar inferencias a partir de muestras aleatorias.

Aplicación
Los estudiantes podrán aplicar los conocimientos orientados en la asignatura
Introducción a la estadística y probabilidad con las asignaturas como el análisis
Integración multivariado, muestreo, ciencia de datos, entre otras.

Mediante el trabajo en equipo, los estudiantes interactúan con sus compañeros


mediante el desarrollo de actividades. En este espacio, los estudiantes podrán verse a
Dimensión humana sí mismos, evaluarse entre sí y apoyarse unos a otros. Es importante que los
estudiantes comprendan la importancia de saber relacionarse con los compañeros y
docentes
Mediante la teoría y aplicaciones vistas en clase los estudiantes estarán interesados en
Compromiso aprender las temáticas desarrolladas en la asignatura; de esta forma los estudiantes
adquieren un mayor compromiso personal para cumplir las metas dentro de la
asignatura y dentro de su vida profesional.

Los estudiantes conocerán algunas fuentes bibliográficas y virtuales que les permitirá
indagar en un futuro sobre inquietudes relacionas con la estadística descriptiva, la
Aprender a aprender probabilidad y la inferencia.

4. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:

Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 5 de 109

DOCUMENTO CONTROLADO

La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de la Estadística.

Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de


las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje (oral y escrito) y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN. El departamento de matemáticas acoge las siguientes
actividades para cumplir con lo referente al crédito educativo:

Tiempo en clase con el Docente (TCD)

Tiempo de taller en clase (TTC )

Tiempo de trabajo independiente. (TTI)

Lecturas previas a cada tema. (TTI).

Exposiciones del profesor (TCD).

Talleres en clase (TTC).

Resolución de problemas. (TCD, TTC, TTI)

Talleres individuales y grupales. (TTC, TTI).

Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).

5. Evaluación y calificación

 60 %: Talleres y trabajos
 40 %: Un Parcial en físico y/o en las plataformas virtuales
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 6 de 109

DOCUMENTO CONTROLADO

6. Cronograma

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Introducción a R, rstudio y el Instalación de R, Rstudio, Clase magistral
lenguaje de programación. instalación de paquetes y sus
dependencias.
2. Conceptos e implementación Teoría y ejercicios Clase magistral
de las estadísticas aplicados a bases de datos.
descriptivas en R
3. Introducción a la probabilidad Teoría y ejemplos de las Clase magistral
distribuciones de probabilidad.
4. Teoría e implementación de Ejercicios prácticos y teóricos Clase magistral
los conceptos básicos de
inferencias (estimador,
intervalo de confianza,
pruebas de hipótesis)
5. Métodos de remuestreo para Ejercicios prácticos y teóricos Clase magistral
la estimación e intervalos de
confianza.
6. Manejo de bases de datos con Ejercicios prácticos y teóricos Clase magistral
R.
7. Procesamiento de bases de Ejercicios prácticos y teóricos Clase magistral
datos mediante listas.
8. Reportes dinámicos con R Ejercicios prácticos y teóricos Clase magistral

7. Bibliografía Básica y Complementaria

- Canavos, G. (1996). Probabilidad y estadística . Aplicaciones y métodos, McGraw-Hill. México D.F.


- Ugarte, M. D., Militino, A. F., & Arnholt, A. T. (2008). Probability and Statistics with R. CRC press.
- Ergül, Ö. (2013). Guide to programming and algorithms using R (pp. I-XI). New York: Springer.
- Abedin, J., & Mittal, H. V. (2014). R Graphs Cookbook Second Edition. Packt Publishing Ltd.
- Sosa, W. (2013). Qué es (y qué no es de la estadística). Editorial ECOES.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 7 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en Estadística aplicada y Ciencia de datos
Nombre de la Asignatura Análisis Multivariado de Datos
Cuatrim
Código de la Asignatura 1 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria x Electiva
Modalidad %: Teórica x Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 40 sincrónicas /periodo 80
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Mario mpachecol@unbosque.edu.co
Pacheco
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

8. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 8 de 109

DOCUMENTO CONTROLADO

En las diferentes ciencias y disciplinas, como la economía, la medicina, la biología, la administración, las
ingenierías, entre otras, es comúnmente necesario describir, agrupar e interpretar la información proveniente de
bases de datos en las que a un grupo de individuos les son medidas un conjunto de variables de interés. Variables
que normalmente se interrelacionan y permiten entender el fenómeno bajo estudio. De esta manera, es necesario
que los estudiantes de la Maestría en Estadística Aplicada y Ciencia de Datos conozcan la mayoría y en especial
las más importantes herramientas multivariadas de análisis de bases de datos multivariadas.

Los profesionales de la Maestría en Estadística Aplicada y Ciencia de Datos tendrán que enfrentarse al análisis
de información que involucran grandes bases de datos, por tanto, es necesario que el estudiante quede
preparado, no solo en los fundamentos teóricos de cada uno de los métodos multivariados de análisis estadístico,
sino que también adquieran habilidades en herramientas informáticas que le permitan desarrollar cada uno de
estos métodos estadísticos de manera eficiente.

9. Contenidos Generales

Unidad 1: Análisis exploratorio de datos multivariados: una introducción.


Unidad 2: Análisis de Componentes Principales, ACP.
 Análisis de componentes principales poblacional
 Análisis de componentes principales muestral
 Aplicaciones del análisis de componentes principales
Unidad 3: Análisis de Correspondencias, AC
 Análisis de correspondencias simple
 Análisis de correspondencias múltiples
 Aplicaciones del análisis de correspondencias
Unidad 4: Análisis de agrupamiento, Clustering.
 Medidas de distancia para diferentes tipos de datos
 Agrupamiento jerárquico
 Agrupamiento no jerárquico
Unidad 5: Análisis discriminante.
 Métodos de análisis discriminante
 Regresión logística y multinomial.

10. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes aprenderán los conceptos teóricos básicos asociados a los principales
métodos de exploración y manejo de bases de datos multivariadas, así como de
Conocimiento algoritmos computacionales para la implementación de estos métodos.
fundamental
Los estudiantes desarrollarán habilidades en la exploración y el manejo de bases de
datos multivariadas y estarán en capacidad de desarrollar algoritmos computacionales
Aplicación que les permitan la implementación de los principales métodos estadísticos
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 9 de 109

DOCUMENTO CONTROLADO

multivariados a diferentes tipos de bases de datos.


Los estudiantes integrarán los conocimientos y habilidades adquiridos en el curso a la
solución de problemas en diferentes áreas del conocimiento, siendo capaces de
Integración implementar estos conocimientos en la elaboración y ejecución de proyectos de
investigación, asesorar acerca del entendimiento y el manejo de información
multivariada y aplicar las herramientas multivariadas más adecuadas a grandes bases
de datos.

El curso permite que los estudiantes interactúen con sus compañeros y docentes, a
través de los distintos escenarios de aprendizaje como talleres, proyectos en grupo y
Dimensión humana demás, esta interacción se da gracias al trato tolerante y respetuoso entre las partes.
Los estudiantes podrán verse a sí mismos como profesionales y seres humanos
capaces de lograr metas y generar soluciones eficientes a las distintas problemáticas
de su área de estudio.

El curso ofrece las bases teóricas y prácticas de los métodos multivariados, de tal
Compromiso forma que se determine su aplicabilidad en el ámbito real, permitiendo que los
estudiantes puedan adquirir un mayor compromiso personal con el aprendizaje
académico de la asignatura y los puedan desarrollar en su vida profesional.
Estarán en capacidad de generar planes de estudio conforme al proceso de aprendizaje
Aprender a aprender adquirido tanto académica como autónomamente, utilizando adecuadamente fuentes
de información y generando nuevas inquietudes en su ámbito profesional.

11. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:

Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.

La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de las ingenierías.

Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de


las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje –oral y escrito- y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN. El departamento de matemáticas acoge las siguientes
actividades para cumplir con lo referente al crédito educativo:
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 10 de 109

DOCUMENTO CONTROLADO

Tiempo en clase con el Docente (TCD)


Tiempo de taller en clase (TTC)
Tiempo de trabajo independiente. (TTI)
Lecturas previas a cada tema. (TTI).
Exposiciones del profesor (TCD).
Talleres en clase (TTC).
Resolución de problemas. (TCD, TTC, TTI)
Talleres individuales y grupales. (TTC, TTI).
Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).
Socialización presencial dirigida por el docente, enfocada a la realimentación de las actividades de evaluación
(TCD, TTI).

12. Evaluación y calificación

El proceso de evaluación tiene como propósito la formación integral del estudiante, sobre la base de una ética
que promueva la tolerancia, la solidaridad, la participación democrática, la creatividad y la equidad; tiene como
principio: ser continua, sistemática, interpretativa y formativa. Está acorde con el propósito de la misión
institucional de: “la promoción de la dignidad de la persona humana en su integralidad y el desarrollo de valores
éticos, morales, estéticos, históricos y tecno-científicos”. Este concepto se puede desglosar en tres partes
esenciales.

1. La evaluación es una actividad sistemática, continua: Es decir que se realiza a lo largo del proceso
de formación del alumno, que se basa en toda clase de datos, informes, pruebas, ejercicios, etc. y que se
sistematiza mediante una serie de sesiones o momentos evaluativos, que se suceden durante el curso. El
docente debe propiciar la evaluación formativa como elemento correctivo y facilitador de la autoevaluación por
parte del estudiante, logrando así los objetivos, los alcances propuestos por este y limitando su labor a ayudar,
corregir y orientar.

2. La evaluación está integrada en el proceso educativo. La evaluación no puede ser algo aparte,
secundario, realizado al final del proceso, debe formar parte de cada tema, de cada unidad, de cada actividad.
Debe encontrarse dentro del mismo proceso, dentro de la programación del trabajo en períodos cortos.

3. La evaluación se relaciona directamente con cada uno de los componentes curriculares. Para
reorientar las debilidades y acentuar las fortalezas determinando hasta qué punto se cumplen los objetivos. En
cuanto a la calificación del aprendizaje se tendrán en cuenta: Talleres resueltos en clase, en casa, parciales,
quices, investigación, exposiciones. Para cada tema se desarrollarán talleres, que podrán ser guiados desde la
tutoría o realizados dentro del proceso de la clase.

13. Cronograma
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 11 de 109

DOCUMENTO CONTROLADO

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Análisis exploratorio de datos Desarrollo de talleres y Clases magistrales y ejemplos de
multivariados trabajos, aplicaciones aplicación con datos reales
computacionales con datos
reales
2. Análisis de componentes Desarrollo de talleres, Clases magistrales y ejemplos de
principales Evaluación parcial, aplicaciones aplicación con datos reales
computacionales con datos
reales
3. Análisis de correspondencias Desarrollo de talleres, Clases magistrales y ejemplos de
simple aplicaciones computacionales aplicación con datos reales
con datos reales
4. Análisis de correspondencias Desarrollo de talleres, Clases magistrales y ejemplos de
múltiple aplicaciones computacionales aplicación con datos reales
con datos reales
5. Análisis de conglomerados: Desarrollo de talleres, Clases magistrales y ejemplos de
métodos jerárquicos Evaluación parcial, aplicaciones aplicación con datos reales
computacionales con datos
reales
6. Análisis de conglomerados: Desarrollo de talleres, Clases magistrales y ejemplos de
métodos no jerárquicos Evaluación parcial, aplicaciones aplicación con datos reales
computacionales con datos
reales
7. Análisis discriminante Desarrollo de talleres, Clases magistrales y ejemplos de
Evaluación parcial, aplicaciones aplicación con datos reales
computacionales con datos
reales
8. Análisis discriminante: Desarrollo de talleres, Clases magistrales y ejemplos de
modelos de regresión Evaluación parcial, aplicaciones aplicación con datos reales
logística y multinomial computacionales con datos
reales

14. Bibliografía Básica y Complementaria

1. Husson, F., Lê, S. Pagès, J. Exploratory Multivariate Analysis by Example Using R. Chapman & Hall,
2011.
2. Härdle, W.K., Simar L. Applied Multivariate Statistical Analysis. 3th ed. Springer, 2012.
3. Johnson, R., Wichern, D. Applied Multivariate Statistical Analysis. 6th ed. Pearson, 2007.
4. Mardia, K., Kent, J., Bibby, J. Multivariate Analysis. Academic Press, 1995.
5. Peng, R. Exploratory Data Analysis with R. 2020. https://bookdown.org/rdpeng/exdata/#stay-in-
touch
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 12 de 109

DOCUMENTO CONTROLADO

6. Rencher, A. Methods of Multivariate Analysis. 2nd ed. Willey, 2002.


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 13 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en Estadística Aplicada y Ciencia de Datos
Nombre de la Asignatura Métodos de regresión
Cuatrim
Código de la Asignatura 1 Periodo Académico I
estre
Área Curricular Ciencias Básicas
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica X Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 10 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co Departamento
Borda de
Matemáticas
Docente(s) Samuel dsmartinez@unbosque.edu.co Departamento
Martínez de
Matemáticas
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

15. Justificación

Los métodos de regresión son un grupo de herramientas estadísticas básicas para el analista de
datos que se enmarca dentro de las metodologías de aprendizaje supervisado en la ciencia de
datos. El curso facilitará a los estudiantes que comprendan y apliquen los diferentes métodos de
regresión en distintas situaciones problema. El curso se concentra en los fundamentos prácticos y
aplicados de los métodos de regresión y en la aplicación que permita la adquisición del
conocimiento en el contexto del aprendizaje significativo.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 14 de 109

DOCUMENTO CONTROLADO

16. Contenidos Generales

Módulo I: Regresión Lineal:


 Regresión lineal Simple: estimación, medidas de bondad de ajuste y aplicaciones.
 Regresión lineal múltiple: estimación, medidas de bondad de ajuste, validación, supuestos estadísticos
y aplicaciones.

Módulo II: Regresión Logística.


 Regresión Logística binaria: estimación, medidas de bondad de ajuste y aplicaciones.
 Regresión Logística multinomial: estimación, medidas de bondad de ajuste y aplicaciones.

Módulo III: Modelo lineal generalizado.


 Regresión lineal con variable respuesta Poisson: estimación, medidas de bondad de ajuste, supuestos
y aplicaciones.
 Regresión lineal con variable respuesta binomial negativa: estimación, medidas de bondad de ajuste,
supuestos y aplicaciones.
 Regresión lineal con variable respuesta gamma: estimación, medidas de bondad de ajuste, supuestos y
aplicaciones.

17. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo

Conocimiento Estimar e interpretar los métodos de regresión. Identificar y seleccionar el modelo de


fundamental regresión adecuado según el tipo de problema y la naturaleza de la variable de interés.

Aplicación Procesar, graficar, analizar e interpretar los métodos de regresión para el análisis de
datos.

Integración Relacionar e integrar los contenidos del curso con los módulos de: estadística
multivariada, machine learging y deep learning. Identificar la interacción entre los
métodos de regresión y las diferentes áreas de conocimiento del programa.

Dimensión humana Afianzar las habilidades de resolución de problemas del futuro científico de datos en el
manejo de los diferentes métodos de regresión y sus aplicaciones en los diferentes
contextos laborales que se puedan presentar.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 15 de 109

DOCUMENTO CONTROLADO

Compromiso Comprender el alcance aplicado que tienen los métodos de regresión a su ejercicio
profesional. Desarrollar el interés por los diferentes métodos de regresión como una
herramienta para el desarrollo de competencias de análisis y modelamiento del futuro
científico de datos.

Aprender a aprender Gestionar su propio conocimiento durante el desarrollo del curso en el desarrollo de
competencias de análisis y modelamiento de datos, para una correcta interpretación y
aplicación en las diferentes situaciones problema que se puedan presentar en su
desarrollo profesional.

18. Actividades generales de aprendizaje

Actividades realizadas en clase:


 Presentación y discusión de conceptos. El docente guiará el proceso de aprendizaje de las
temáticas del curso.
 Manejo de R. Los estudiantes desarrollaran competencias de manejo de software en la
clase.
 Talleres donde los estudiantes desarrollaran problemas aplicados de las temáticas
aprendidas en el curso.
Actividades Independientes:
 Revisión y aplicación de los problemas desarrollados en el contenido multimedia de apoyo
(videos.)
 Desarrollo de problemas prácticos de las diferentes temáticas desarrolladas.
 Revisión y desarrollo de material y archivos de soporte que se encuentran en el aula virtual
del curso.
 Diseño de Ficha de resumen del curso, para tener una visión clara y sencilla de los
contenidos adquiridos.

19. Evaluación y calificación

Talleres semanales en el aula: 25%


Trabajos semanales para desarrollo individual: 25%
Examen Final: 50%

20. Cronograma
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 16 de 109

DOCUMENTO CONTROLADO

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Módulo I. Introducción a la Presentación del curso y
asignatura. Regresión lineal discusión de la dinámica de
Simple. trabajo.
Clase magistral: conceptos
teóricos, ejemplos de problemas
prácticos y práctica con R.
2. Módulo I. Regresión lineal Lecturas: Dunn, P. & Smyth, G. Clase magistral: conceptos
múltiple I. (2018). Generalized linear teóricos, ejemplos de problemas
models with examples in R. Cap prácticos y práctica con R.
3, página 31.
Revisión de contenidos
multimedia. Desarrollo de
problemas y situaciones
problemas aplicados.
3. Módulo I. Regresión lineal Lecturas: Dunn, P. & Smyth, G. Clase magistral: conceptos
múltiple II. (2018). Generalized linear teóricos, ejemplos de problemas
models with examples in R. Cap prácticos y práctica con R.
3, página 31.

Revisión de contenidos
multimedia. Desarrollo de
problemas y situaciones
problemas aplicados.
4. Módulo II. Regresión logística Lecturas: Hosmer, D., Clase magistral: conceptos
con respuesta binaria. Lemeshow, S. & Sturdivant, R. teóricos, ejemplos de problemas
(2013). Applied logistic prácticos y práctica con R.
regression. Cap 2, página 35.
Revisión de contenidos
multimedia. Desarrollo de
problemas y situaciones
problemas aplicados.
5. Módulo II. Regresión logística Lecturas: Hosmer, D., Clase magistral: conceptos
con respuesta multinomial. Lemeshow, S. & Sturdivant, R. teóricos, ejemplos de problemas
(2013). Applied logistic prácticos y práctica con R.
regression. Cap 8, página 269.
Revisión de contenidos
multimedia. Desarrollo de
problemas y situaciones
problemas aplicados.
6. Módulo III. Regresión lineal Lecturas: Dunn, P. & Smyth, G. Clase magistral: conceptos
con variables respuesta (2018). Generalized linear teóricos, ejemplos de problemas
Poisson. models with examples in R. Cap prácticos y práctica con R.
10, página 371.
Revisión de contenidos
multimedia. Desarrollo de
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 17 de 109

DOCUMENTO CONTROLADO

problemas y situaciones
problemas aplicados.
7. Módulo III. Regresión lineal Lecturas: Dunn, P. & Smyth, G. Clase magistral: conceptos
con variables respuesta (2018). Generalized linear teóricos, ejemplos de problemas
binomial negativa. models with examples in R. Cap prácticos y práctica con R.
10, página 371.
Revisión de contenidos
multimedia. Desarrollo de
problemas y situaciones
problemas aplicados.
8. Módulo III. Regresión lineal Lecturas: Dunn, P. & Smyth, G. Clase magistral: conceptos
con variables respuesta (2018). Generalized linear teóricos, ejemplos de problemas
gamma. models with examples in R. Cap prácticos y práctica con R.
11, página 425. Examen Final.
Revisión de contenidos
multimedia. Desarrollo de
problemas y situaciones
problemas aplicados.

21. Bibliografía Básica y Complementaria

Básica.
Dunn, P. & Smyth, G. (2018). Generalized linear models with examples in R. Springer, New York.
Hosmer, D., Lemeshow, S. & Sturdivant, R. (2013). Applied logistic regression. Wiley, New York.
Complementaria.
Rawlings, J., Pantulua, S. & Dickey, D. (2010). Applied regression analysis: a research tool. Springer, New York.
Faraway, J. (2006). Extending the linear model with R. Chapman & Hall, New York.
Hilbe, J. (2007). Negative Binomial Regression. Cambridge, New York.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 18 de 109

DOCUMENTO CONTROLADO

Facultad Ciencias
Programa Maestría en Estadística y Ciencia de datos
Nombre de la Asignatura Muestreo Probabilístico
Cuatrim
Código de la Asignatura 2 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Cristian tellezcristian@unbosque.edu.co
Téllez
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

22. Justificación

El estudiante de la Maestría en Estadística Aplicada y ciencia de datos se verá enfrentado a diferentes retos de
tipo estadísticos cuando no es posible por diversos factores, medir una variable o una característica de interés
en toda una población sino solamente en una parte de esta. El curso se centra en métodos probabilísticos de
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 19 de 109

DOCUMENTO CONTROLADO

muestreo que permiten trabajar adecuadamente los análisis inferenciales hechos para una población basada en
una parte de ella. Es necesario que el estudiante adquiera los conocimientos básicos del quehacer estadístico
frente al diseño y procesamiento de una encuesta o estudio y que pueda identificar qué tipo de herramientas, a
saber, diseño, estimador y estimador de varianza, son adecuadas y presentan ventajas de optimización práctica
y teórica frente a otras alternativas.

El adquirir las herramientas de muestreo le permitirá al estudiante identificar las condiciones en que se puede
establecer un diseño muestral y todas sus implicaciones, con el objetivo de hacer una adecuada estimación de
los parámetros de interés que gobiernan el estado de la naturaleza de los fenómenos bajo estudio, en particular
el total, el promedio, la desviación o correlación de una o más variables numéricas. Con esto, el estudiante podrá
brindar las herramientas precisas, adecuadas y técnicamente bien elaboradas, que permiten la adecuada toma
de decisiones.

El curso pretende desarrollar en el estudiante el criterio estadístico del muestreo, con el objetivo de que adquiera
competencias que acompañen los análisis estadísticos y matemáticos basados en una muestra probabilística.
Todo lo mencionado anteriormente es lo que justifica la incorporación de este espacio académico en el programa
de Maestría en Estadística Aplicada y ciencia de datos y así participar con juicios de valor en la toma de decisiones
basándose en un adecuado análisis de información.

23. Contenidos Generales

1. Introducción al muestreo probabilístico

2. Muestreo Bernoulli

3. muestreo aleatorio simple

4. muestreo sistemático

5. muestreo estratificado

6. muestreo por conglomerados

7. introducción a otros diseños muéstrales

8. diseño de muestreo con información auxiliar

9. estimación de parámetros complejos

24. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes deben tener conocimientos en Probabilidad y Estadística general,
principalmente: Cálculo de probabilidades, intervalos de confianza, distribuciones de
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 20 de 109

DOCUMENTO CONTROLADO

Conocimiento probabilidad, propiedades de los estimadores y cálculo de varianzas y sesgos.


fundamental Adicionalmente, debe tener conocimientos básicos en estadística exploratoria y lógica
de programación, principalmente que tenga conocimientos básicos de programación
en R.
Con el contenido de este curso, el estudiante adquiere habilidades para proponer
diseños de muestreo que permitan realizar estudios de mercado, estudios de política
pública entre otros. Adicional, se pueden realizar encuestas de intención de votos,
medir el crecimiento de la educación de un País, así como los ingresos promedios
Aplicación mensuales de las familias colombianas.
Como bien se mencionó anteriormente, se puede integrar utilizando las técnicas
aprendidas en el curso para poder estimar parámetros tales como promedios,
Integración proporciones, razones, entre otros.
Generar conciencia del manejo adecuado de las herramientas tecnológicas y de las
diversas fuentes de información que se encuentran en la web. Desarrollar la capacidad
Dimensión humana de trabajo en grupo y la habilidad de argumentar las ideas que contribuyan a la
solución de modelos, validando las opiniones de los demás.
Valorar los espacios tanto físicos como académicos que ofrece la
Compromiso universidad para el aprendizaje y Resaltar la importancia del compromiso que debe
tener con su aprendizaje.
Identificar fuentes de información académicas y su correcta utilización. Que
contribuyan a afianzar el conocimiento adquirido en el aula. De manera que el
Aprender a aprender constante aprendizaje se vuelva un hábito en su vida personal y profesional.

25. Actividades generales de aprendizaje

El espacio académico busca proporcionar al estudiante las diferentes alternativas metodológicas que ofrecen
los distintos diseños de muestreo para la estimación de los parámetros de interés que podrían presentarse en
su entorno profesional, con esto podrá hacer propuestas estadísticas de diseño de muestreo con el fin de
garantizar inferencias con características óptimas deseables. Este espacio académico se encuentra dentro del
núcleo problémico denominado desde los elementos que aporta al análisis de los Magíster tomasinos, pretende
incorporar los criterios relacionados con la perspectiva propia de la universidad, relacionada con el Humanismo
Tomista, y ser instrumento válido para trabajar en torno al núcleo relacionado con Exclusión Social, Políticas
Públicas, Mercado Y Productividad.
El propósito general del espacio académico es Entrenar a los estudiantes en las técnicas de muestreo
probabilístico más usadas en la planeación y ejecución de encuestas complejas para la producción de
estadísticas oficiales y proveer las mejores herramientas técnicas para el correcto análisis estadístico en este
tipo de encuestas. En este sentido busca:
 Introducir los conceptos básicos de muestreo de elementos.
 Introducir los conceptos básicos de muestreo de conglomerados.
 Familiarizar al estudiante con los la estimación de parámetros lineales y no lineales.
 Generar en el estudiante la capacidad de estimar parámetros de modelos estadísticos complejos.
Capacitar al estudiante en la estimación de varianza de los estimadores de muestreo.

26. Evaluación y calificación


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 21 de 109

DOCUMENTO CONTROLADO

 60 %: Talleres y trabajos
 40 %: Un Parcial en físico o en las plataformas virtuales

27. Cronograma (ajustar a 8 sesiones)

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Introducción, comprensión Ejercicios Prácticos y teóricos Clases magistrales
problemática y conceptos
básicos
2. Diseños de muestreo de Ejercicios Prácticos y teóricos Clases magistrales
elementos con probabilidades
probabilidades simples. MAS,
Bernoullí y Sistemático.
3 Diseños de muestreo de Ejercicios Prácticos y teóricos Clases magistrales
elementos con probabilidades
proporcionales al tamaño.
PPT, PiPT y Poisson.
4 Diseños de muestreo Ejercicios Prácticos y teóricos Clases magistrales
Estratificado
5 Diseño de muestreo en Ejercicios Prácticos y teóricos Clases magistrales
Conglomerado
6 Diseño de muestreo en varias Ejercicios Prácticos y teóricos Clases magistrales
etapas
7 Estimadores diferentes al Ejercicios Prácticos y teóricos Clases magistrales
total Parte. Razones
8 Estimadores diferentes al Ejercicios Prácticos y teóricos Clases magistrales
total. Proporciones y
medianas.

28. Bibliografía Básica y Complementaria

 Särndal, Swensson and Wretman (2003). Model Assited Survey Sampling. Springer.
 Wolter (2007). Introduction to Variance Estimation. Springer.
 Gutiérrez (2013). Estrategias de muestreo: diseño de encuestas y estimación de parámetros.Ediciones
de la U.
 Valliant, Dever and Kreuter (2013). Practical Tools for Designing and Weighting Survey Samples.
Springer.
 Lehtonen and Pahkinen (2004). Practical Methods for Design and Analysis of Complex Surveys. John
Wiley and Sons.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 22 de 109

DOCUMENTO CONTROLADO

Facultad FACULTAD DE CIENCIAS


Programa MAESTRIA EN ESTADISTICA Y CIENCIAS DE DATOS
Nombre de la Asignatura MACHINE LEARNING I
Cuatrim
Código de la Asignatura 2 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 40 sincrónicas /periodo
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 80

EQUIPO DOCENTE

Horario Espacio
Nombre Correo Electrónico Atención A de
Estudiantes atención a
(Día – Hora) estudiantes
Coordinador(es) Ricardo Borda bordaricardo@unbosque.edu.co

Docente(s) Carlos cpuentesm@unbosque.edu.co


Alberto
Puentes
Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 23 de 109

DOCUMENTO CONTROLADO

El éxito empresarial hoy en día se debe a la gran cantidad de datos que se posean, su transformación y las
decisiones que se puedan tomar basadas en estos. En este contexto, las empresas son conscientes hoy en día
de la importancia de los datos y, por lo tanto, están elaborando medidas estratégicas y operacionales que
permitirán adquirir las aptitudes y los conocimientos necesarios para lograr nuevos beneficios analíticos basados
en nuevos datos de gran tamaño junto con metodologías para tratamiento de información como el aprendizaje
automático de forma supervisada, no supervisada, semi-supervisada o reforzada.

Aporte al proyecto educativo institucional y del programa: La Universidad El Bosque, sigue


reconociendo en su Plan de Desarrollo Institucional 2016-2021 la importancia y la decisión de promover la
formación integral desde su enfoque bio-psico-social y cultural. De allí que se pueda ver en el Plan de
Desarrollo institucional los compromisos adquiridos en términos de “realizar ajustes en la denominación, en los
componentes curriculares, en la intensificación de las prácticas bajo la filosofía del aprender haciendo, donde a
través de esta asignatura se mostrará la importancia de la ejecución de proyectos académicos bajo el
andamiaje teórico matemático-estadístico-algorítmico para llevar a cabo la adquisición de las competencias de
un científico de datos.

2. Contenidos Generales

1. Introducción a la algoritmia con Python


2. Procesamiento y Análisis Exploratorio de Datos
3. Machine Learning (Aprendizaje Supervisado)
4. Algoritmos de Regresión y métricas
5. Algoritmos de Clasificación y métricas
6. Machine Learning (Aprendizaje Semi-Supervisado)

3. Objetivos de aprendizaje

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Comprender críticamente y argumentar los fundamentos teóricos, conceptuales y
Conocimiento metodológicos del aprendizaje de maquina desde su enfoque supervisado y semi-
fundamental supervisado, reconociendo el objetivo y el alcance de los mismos, marcos de
referencia y/o buenas prácticas, Identificando fortalezas y debilidades a la hora de
implementarlos en un proyecto.

Expresar un pensamiento crítico y creativo hacia el conocimiento de los procesos


metodológicos de los algoritmos de aprendizaje supervisado y semi-supervisado,
evaluando su eficacia e idoneidad para la ejecución de proyectos.
Aplicación
Diseñar soluciones desde el pensamiento práctico fundamentadas en casos
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 24 de 109

DOCUMENTO CONTROLADO
específicos, evaluando su validez en términos de los requerimientos funcionales
del caso en mención.

Identificar, analizar, comprender y relacionar los conceptos fundamentales en


Integración términos teóricos y algorítmicos del aprendizaje de máquina, tanto en sus
propios campos de acción como con otras áreas del conocimiento.

Reconocer la importancia del procesamiento de los datos para el aprendizaje de


Dimensión humana máquina y las relaciones con su entorno.

Colaborar y cooperar con otros profesionales, del campo de estadística,


matemática y ciencias de datos, o de otras disciplinas, de manera que
contribuya bajo criterios éticos en la toma de decisiones y el desarrollo exitoso
de los programas en los que se vea involucrado.

Gestionar cambios metodológicos a partir de su saber y hacer personal,


Compromiso disciplinario y profesional, fundamentado en los procesos de aprendizaje de
maquina en su enfoque supervisado y semi-supervisado y sus relaciones en pro
de la responsabilidad social y empresarial que le rodea.

Evalúa y potencializa sus habilidades para indagar e investigar acerca de las


Aprender a aprender nuevas tendencias, enfoques, metodologías y buenas prácticas necesarias al
momento de abordar un proyecto con aprendizaje de máquinas.

4. Actividades generales de aprendizaje

La estrategia pedagógica que se trabajara a lo largo del curso es Aprendizaje Basado en Proyectos. Es
una metodología en la que se investiga, interpreta, argumenta y propone la solución a uno o varios
proyectos, creando un escenario simulado de posible solución y analizando las probables consecuencias
(Pimienta, 2012).

Para este tipo de asignaturas de naturaleza teórica y práctica es fundamental tener en cuenta que los
medios educativos necesarios para las sesiones presenciales son: una sala de informática y una cuenta
de correo institucional para el desarrollo los laboratorios.

Referencia:

Pimienta, J (2012). Estrategias de enseñanza-aprendizaje. Editorial Pearson, México.

Relación de la Estrategia Pedagógica con las actividades:

La estrategia pedagógica se encuentra dividida en dos etapas:

- Etapa de conceptualización, esta etapa dura 8 semanas durante este espacio de tiempo los
estudiantes realizarán lecturas guiadas con el objetivo de comprender la base teórica del aprendizaje
de maquina en su enfoque supervisado y semi-supervisado.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 25 de 109

DOCUMENTO CONTROLADO

- Etapa de solución de ejercicios prácticos o análisis de casos, paralelamente a la etapa de


conceptualización esta etapa dura también 8 semanas durante este espacio de tiempo los
estudiantes presentarán soluciones a través de entregables para retroalimentación del docente.

Al finalizar la asignatura el estudiante entregará una implementación de un proyecto propio basado en el


aprendizaje de maquina bajo el enfoque supervisado o semi-supervisado.

5. Evaluación y calificación

Nombre Actividad de Aprendizaje / de Calificación (


Semana Temas
Evaluación % del 100%)
Evaluación Anticipatoria
1 Introducción a la asignatura Taller de Ejercicios Numpy, Matplotlib, 5%
Pandas y Graficas de dispersión
Taller de Ejercicios de procesamiento de
5%
datos
2 Unidad 1
Taller de Ejercicios sobre Análisis 5%
Exploratorio de los datos
Taller de Ejercicios de Regresión Lineal,
3 5%
Lasso y Ridge
Taller de ejercicios sobre Métricas de
regresión, Regresión Polinómica, Redes
5%
Unidad 2 Elásticas, Máquinas de Vector de
Soporte.
4
Taller de ejercicios de Validación de
modelos, Sesgo/ Varianza, curvas de
validación, curvas de aprendizaje y
Bootstrapping.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 26 de 109

DOCUMENTO CONTROLADO

Taller de ejercicios de Algoritmos de


5 Clasificación: Regresión Logística, 5%
Máquinas de Vector de Soporte.
Taller de ejercicios de Redes
Neuronales, Backpropagation y
6 Forwardpropagation, Métricas de 5%
Clasificación, Tipos de error, datos no
Unidad 3
balanceados, Matriz de confusión.
Taller de ejercicios de K-Nearest
Neighbors y Naive Bayes, Árboles de
decisión y Gradient Boosting.
7 5%
Aprendizaje Semi-supervisado, pseudo-
etiquetamiento de los datos o Label
propagation
Entrega y Socialización del Trabajo Final 45%
Autoevaluación (Obligatoria en línea
Auto y coevaluación 3%
Asincrónica)
8

Refuerzo y Retroalimentación Evaluación del Curso. 2%

Total del Porcentaje 100%

6. Cronograma

Actividades
Seman Actividades
acompañamiento
a/Sesió Módulo y temas Independientes de
directo (Presencial o
n Aprendizaje: Asincrónico
sincrónica)
1. Módulo 1. Presentación del Presentación de los tema Exposición del docente y
Curso, contenidos usando las TIC ejercicios en tiempo real
programáticos, acuerdos Entrega del material de
generales, cronograma de trabajo para el semestre,
prueba diagnóstica.
actividades, aplicación de Lectura previa capítulo 1 de
prueba diagnóstica y Dangeti.
retroalimentación. Lectura previa capítulo 2, 3 y
Introducción a Python. 4 de Fandango y Lectura
Tema 1. Numpy, Matplotlib, previa capítulo 2, 3 y 4 de
Chin
Pandas y Graficas de
dispersión
2. Tema 2. Procesamiento de Lectura previa capítulo 4 de Exposición del docente y
Datos y Análisis Exploratorio Raschka, Lectura previa ejercicios en tiempo real
capítulo 5 de Massaron y
Lectura previa capítulo 2 de
Babcock
3. Módulo 2. Lectura previa capítulo 2 de Exposición del docente y
Dangeti, Lectura previa capítulo ejercicios en tiempo real
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 27 de 109

DOCUMENTO CONTROLADO

Tema 1. Aprendizaje 3 de Raschka y Lectura previa


Supervisado: Introducción capítulo 5 de Massaron
al Machine Learning y
Regresión Lineal, Lasso y
Ridge
4. Tema 2. Lectura previa capítulo 6 de Exposición del docente y
Métricas de regresión, Dangeti y Lectura previa ejercicios en tiempo real
Regresión Polinómica, Redes capítulo 6 de Beyeler,
Elásticas, Máquinas de Vector
de Soporte.
Tema 3. Validación de
modelos, Sesgo/ Varianza,
curvas de validación, curvas
de aprendizaje y
Bootstrapping.
5. Módulo 3. Lectura previa capítulo 3 de Exposición del docente y
Tema 1. Algoritmos de Dangeti, Lectura previa ejercicios en tiempo real
Clasificación: Regresión capítulo 3 de Raschka y Lectura
Logística, Máquinas de previa capítulo 5 de Massaron
Vector de Soporte.
6. Tema 2. Redes Neuronales, Lectura previa capítulo 12 de Exposición del docente y
Backpropagation y Raschka. Lectura previa ejercicios en tiempo real
Forwardpropagation, capítulo 5 de Vander
Métricas de Clasificación,
Tipos de error, datos no
balanceados, Matriz de
confusión
7. Tema 3. K-Nearest Lectura previa capítulo 4 y 5 de Exposición del docente y
Neighbors y Naive Bayes. Dangeti, Lectura previa capítulo ejercicios en tiempo real
Árboles de decisión y 5 y 7 de Beyeler y Lectura
Gradient Boosting. previa capítulo 5 de Vander,
Aprendizaje Semi- Lectura previa capítulo 3 y 4 de
supervisado, pseudo- Chapelle
etiquetamiento de los datos
o Label propagation.
8. Tutoría de proyecto de Presentación parcial del Socialización docente y
Investigación proyecto. estudiante

7. Bibliografía Básica y Complementaria


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 28 de 109

DOCUMENTO CONTROLADO

Dangeti, P. (2017). Statistics for Machine Learning. Packt Publishing.

Raschka, S., & Mirjalili, V. (2017). Python Machine Learning - Second Edition: Vol. 2nd ed. Packt
Publishing.

Bibliografía Complementaria

Babcock, J. (2016). Mastering Predictive Analytics with Python. Packt Publishing.

Beyeler, M. (2017). Machine Learning for OpenCV. Packt Publishing.

Chin, L., & Dutta, T. (2016). NumPy Essentials. Packt Publishing.

Fandango, A. (2017). Python Data Analysis - Second Edition: Vol. Second edition. Packt Publishing.

Heydt, M. (2015). Learning Pandas. Packt Publishing.

Isoni, A., & Cervellin, D. (2016). Machine Learning for the Web. Packt Publishing.

Massaron, L., & Boschetti, A. (2016). Regression Analysis with Python. Packt Publishing.

Olivier Chapelle, Bernhard Schölkopf, & Alexander Zien. (2006). Semi-Supervised Learning. The MIT

Press.

Vander, J. (2016). Python data science handbook, O’Reilly


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 29 de 109

DOCUMENTO CONTROLADO

Facultad FACULTAD DE CIENCIAS


Programa MAESTRIA EN ESTADISTICA Y CIENCIAS DE DATOS
Nombre de la Asignatura DEEP LEARNING I
Cuatrim
Código de la Asignatura 2 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 40 sincrónicas /periodo
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 80

EQUIPO DOCENTE

Horario Espacio
Nombre Correo Electrónico Atención A de
Estudiantes atención a
(Día – Hora) estudiantes
Coordinador(es) Ricardo Borda bordaricardo@unbosque.edu.co

Docente(s) Carlos cpuentesm@unbosque.edu.co


Alberto
Puentes
Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 30 de 109

DOCUMENTO CONTROLADO

En la mayoría de proyectos en los cuales un científico de datos emprende o colabora, debe saber solucionar
problemas que se plantean dentro del mismo proyecto, haciendo uso eficiente del razonamiento matemático y
estadístico en sinergia con los algoritmos a implementar, a fin de presentar soluciones concretas y sustentables en
el tiempo. Por lo tanto, todo científico de datos debe poseer herramientas matemáticas y estadísticas para resolver
problemas a través de algoritmos sofisticados de aprendizaje profundo de maquina con alta precisión y aplicación
en el sector salud, banca, gobierno u otros, aprovechando al máximo la capacidad de cómputo de los ordenadores
o en su defecto máquinas virtuales montadas en servidores en la nube, para llevar a cabo dichos proyectos de
forma eficiente.

Aporte al proyecto educativo institucional y del programa: La Universidad El Bosque, sigue


reconociendo en su Plan de Desarrollo Institucional 2016-2021 la importancia y la decisión de promover la
formación integral desde su enfoque bio-psico-social y cultural. De allí que se pueda ver en el Plan de
Desarrollo institucional los compromisos adquiridos en términos de “realizar ajustes en la denominación, en los
componentes curriculares, en la intensificación de las prácticas bajo la filosofía del aprender haciendo, donde a
través de esta asignatura se mostrará la importancia de la ejecución de proyectos académicos bajo el
andamiaje teórico matemático-estadístico-algorítmico para llevar a cabo la adquisición de las competencias de
un científico de datos.

2. Contenidos Generales

1. Introducción a Deep Learning


2. Perceptron simple y modelado de una RNA.
3. Perceptron multicapa, forward-propagation y back-propagation, y Funciones de Activación
4. Redes Neuronales Profundas, Regularización, Bach Normalization, Optimizadores y Visualización
5. Redes Neuronales Convolutivas y Transferencia de Aprendizaje.
6. Detección de Objetos, Detección de rostros, Detección de Ojos,
7. Redes Neuronales Recurrentes y Long-Short Term Memory (LSTM).
8. NPL y Series de Tiempo.
9. Aprendizaje No Supervisado Hopfield Network y Continuous Time RNN, Deep Belief Networks y Deep Boltzman
Machines
10. Aprendizaje Reforzado, Políticas y Deep Q-Learning

3. Objetivos de aprendizaje

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Comprender críticamente y argumentar los fundamentos teóricos, conceptuales y
Conocimiento metodológicos del aprendizaje profundo de maquina desde su enfoque
fundamental supervisado, no supervisado y reforzado, reconociendo el objetivo y el alcance de
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 31 de 109

DOCUMENTO CONTROLADO
los mismos, marcos de referencia y/o buenas prácticas, Identificando fortalezas y
debilidades a la hora de implementarlos en un proyecto.

Expresar un pensamiento crítico y creativo hacia el conocimiento de los procesos


metodológicos de los algoritmos de aprendizaje profundo supervisado, no
supervisado y reforzado, evaluando su eficacia e idoneidad para la ejecución de
Aplicación proyectos.
Diseñar soluciones desde el pensamiento práctico fundamentadas en casos
específicos, evaluando su validez en términos de los requerimientos funcionales
del caso en mención.

Identificar, analizar, comprender y relacionar los conceptos fundamentales en


Integración términos teóricos y algorítmicos del aprendizaje profundo de máquina, tanto
en sus propios campos de acción como con otras áreas del conocimiento.

Reconocer la importancia del procesamiento de los datos para el aprendizaje de


Dimensión humana máquina y las relaciones con su entorno.

Colaborar y cooperar con otros profesionales, del campo de estadística,


matemática y ciencias de datos, o de otras disciplinas, de manera que
contribuya bajo criterios éticos en la toma de decisiones y el desarrollo exitoso
de los programas en los que se vea involucrado.

Gestionar cambios metodológicos a partir de su saber y hacer personal,


Compromiso disciplinario y profesional, fundamentado en los procesos de aprendizaje
profundo de maquina en su enfoque supervisado, no supervisado y reforzado y
sus relaciones en pro de la responsabilidad social y empresarial que le rodea.

Evalúa y potencializa sus habilidades para indagar e investigar acerca de las


Aprender a aprender nuevas tendencias, enfoques, metodologías y buenas prácticas necesarias al
momento de abordar un proyecto con aprendizaje de máquinas.

4. Actividades generales de aprendizaje


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 32 de 109

DOCUMENTO CONTROLADO

La estrategia pedagógica que se trabajara a lo largo del curso es Aprendizaje Basado en Proyectos. Es
una metodología en la que se investiga, interpreta, argumenta y propone la solución a uno o varios
proyectos, creando un escenario simulado de posible solución y analizando las probables consecuencias
(Pimienta, 2012).

Para este tipo de asignaturas de naturaleza teórica y práctica es fundamental tener en cuenta que los
medios educativos necesarios para las sesiones presenciales son: una sala de informática y una cuenta
de correo institucional para el desarrollo los laboratorios.

Referencia:

Pimienta, J (2012). Estrategias de enseñanza-aprendizaje. Editorial Pearson, México.

Relación de la Estrategia Pedagógica con las actividades:

La estrategia pedagógica se encuentra dividida en dos etapas:

- Etapa de conceptualización, esta etapa dura 8 semanas durante este espacio de tiempo los
estudiantes realizarán lecturas guiadas con el objetivo de comprender la base teórica del aprendizaje
de maquina en su enfoque supervisado, no supervisado y reforzado.

- Etapa de solución de ejercicios prácticos o análisis de casos, paralelamente a la etapa de


conceptualización esta etapa dura también 8 semanas durante este espacio de tiempo los
estudiantes presentarán soluciones a través de entregables para retroalimentación del docente.

Al finalizar la asignatura el estudiante entregará una implementación de un proyecto propio basado en el


aprendizaje de maquina bajo el enfoque supervisado, no supervisado y reforzado.

5. Evaluación y calificación

Nombre Actividad de Aprendizaje / de Calificación (


Semana Temas
Evaluación % del 100%)
Evaluación Anticipatoria
Taller de Ejercicios de Tensores, El
1 Introducción a la asignatura 5%
perceptron simple y modelado de una
RNA
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 33 de 109

DOCUMENTO CONTROLADO

. Taller de Ejercicios de Perceptron


multicapa, forward-propagation y back- 5%
2 propagation, y Funciones de Activación
Unidad 1 Taller de Ejercicios de Redes
Neuronales Profundas, Regularización,
5%
3 Bach Normalization, Optimizadores y
Visualización.

4 Taller de ejercicios de Arquitectura de


CNN complejas y Transferencia de 10%
Unidad 2 Aprendizaje.

5 Taller de ejercicios de Detección de


Objetos, Detección de rostros, 5%
Detección de Ojos
Taller de ejercicios de Redes
5%
6 Neuronales Recurrentes y Long-Short
Term Memory (LSTM).
Taller de ejercicios de Aprendizaje No
Unidad 3
Supervisado Hopfield Network y Deep 5%
Boltzman Machines.
7
Taller de ejercicios de Aprendizaje
5%
Reforzado, Método Monte Carlo.
Entrega Trabajo Final 50%
Socialización Trabajo Final
Auto y coevaluación Autoevaluación (Obligatoria en línea 3%
8 Asincrónica)

Refuerzo y Retroalimentación Evaluación del Curso. 2%

Total del Porcentaje 100%

6. Cronograma

Actividades
Seman Actividades
acompañamiento
a/Sesió Módulo y temas Independientes de
directo (Presencial o
n Aprendizaje: Asincrónico
sincrónica)
1 Módulo 1. Presentación del Presentación de los tema Exposición del docente.
Curso, contenidos usando las TIC
programáticos, acuerdos Entrega del material de
generales, cronograma de trabajo para el semestre,
prueba diagnóstica.
actividades, aplicación de Lectura previa capítulo 1
prueba diagnóstica y de Zaccone y Lectura
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 34 de 109

DOCUMENTO CONTROLADO

retroalimentación. previa capítulo 2 de


Introducción a Deep Bakker
Learning.
Tema 1. Tensores, El Lectura previa capítulo 2 de Exposición del docente y
perceptron simple y Bakker, Lectura previa capítulo ejercicios en tiempo real
modelado de una RNA. 2 de Zaccone y Lectura previa
capítulo 1 de Gulli
2 Tema 2. Perceptron Lectura previa capítulo 3 de Exposición del docente y
multicapa, forward- Zaccone y Lectura previa ejercicios en tiempo real
propagation y back- capítulo 2 de Zocca
propagation, y Funciones de
Activación
Tema 3. Pipelines, Lectura previa capítulo 1 y 2 de Presentación del proyecto de
protocolos de validación y Gulli y Lectura previa capítulo investigación
Redes Neuronales 11 de Bernico.
Secuenciales
3 Tema 4. Redes Neuronales Lectura previa capítulo 1, 2 y 3 Exposición del docente y
Profundas, Regularización, de Bernico y Lectura previa ejercicios en tiempo real
Bach Normalization, capítulo 2 de Bakker.
Optimizadores y
Visualización
Tema 5. Funciones de Lectura previa capítulo 15 de Exposición del docente y
pérdida y Redes Neuronales Raschka, Lectura previa ejercicios en tiempo real
Convolucionales. capítulo 6 de Bonnin, Lectura
previa capítulo 4 de Zaccone
4 Módulo 2. Lectura previa capítulo 8 de Exposición del docente y
Tema 1. Bernico y Lectura previa ejercicios en tiempo real
Arquitectura de CNN capítulo 12 de Fandango.
complejas y Transferencia de
Aprendizaje.
Tema 2. Autoencoders, Lectura previa capítulo 5 de Presentación del proyecto de
PCA, Convolucional Zaccone y Lectura previa investigación
Autoencoders, Segmentación capítulo 7 de Bernico.
y Aumentación de los datos.
5 Tema 3. Detección de Lectura previa capítulo 13 de Exposición del docente y
Objetos, Detección de Joshi. ejercicios en tiempo real
rostros, Detección de Ojos,
6 Módulo 3. Lectura previa capítulo 16 de Exposición del docente y
Tema 1. Redes Neuronales Raschka, Lectura previa ejercicios en tiempo real
Recurrentes y Long-Short capítulo 7 de Bonnin y Lectura
Term Memory (LSTM). previa capítulo 6 de Zaccone
Tema 2. Gradient Lectura previa capítulo 4 de Exposición del docente y
Recurrent Unit (GRU), Bi- Bakker y Lectura previa ejercicios en tiempo real
directional RNN. capítulo 6 de Zaccone.
Tema 3. NPL y Series de Lectura previa capítulo 10 de Exposición del docente y
Tiempo, Joshi y Lectura previa capítulo ejercicios en tiempo real
9 y 11 de Bernico.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 35 de 109

DOCUMENTO CONTROLADO

7 Tema 4. Aprendizaje No Lectura previa capítulo 7 de Exposición del docente y


Supervisado Hopfield Gulli y Lectura previa capítulo 4 ejercicios en tiempo real
Network y Continuous Time de Zocca
RNN, Deep Belief Networks y
Deep Boltzman Machines.

Tema 5. Aprendizaje Lectura previa capítulo 6 de Exposición del docente y


Reforzado, Políticas y Deep Bakker, Lectura previa capítulo ejercicios en tiempo real
Q-Learning 8 de Gulli, Lectura previa
capítulo 7 y 8 de Zocca y
Lectura previa capítulo 12 de
Bernico.
8 Parcial. Proyecto de Entrega del proyecto. Presentación del proyecto de
Investigación investigación

7. Bibliografía Básica y Complementaria

Zaccone, G., Karim, M. R., & Menshawy, A. (2017). Deep Learning with TensorFlow. Packt Publishing.

Bakker, I. den. (2017). Python Deep Learning Cookbook. Packt Publishing.

Bibliografía Complementaria

Bernico, M. (2018). Deep Learning Quick Reference : Useful Hacks for Training and Optimizing Deep Neural
Networks with TensorFlow and Keras. Packt Publishing.

Bonnin, R. (2017). Machine Learning for Developers. Packt Publishing.

Fandango, A. (2018). Mastering TensorFlow 1.x : Advanced Machine Learning and Deep Learning Concepts
Using TensorFlow 1.x and Keras. Packt Publishing.

Goodfellow I., Bengio Y., Courville A., (2016) Deep Learning (Adaptive Computation and Machine Learning
series), Publisher: The MIT Press, , ISBN-10: 0262035618, ISBN-13: 978-0262035613.

Gulli, A. (2017). Deep Learning with Keras. Packt Publishing.

Joshi, P. (2017). Artificial Intelligence with Python. Packt Publishing.

Zocca, V., Spacagna, G., Slater, D., & Roelants, P. (2017). Python Deep Learning. Packt Publishing.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 36 de 109

DOCUMENTO CONTROLADO
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 37 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en Estadística aplicada y Ciencia de datos
Nombre de la Asignatura Métodos de Machine Learning en Bioestadística
Cuatrim
Código de la Asignatura 2 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria Electiva
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 10 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día –
Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Jesús  jdramos@unbosque.edu.co
David  erodriguezar@unbosque.edu.co
Ramos
Emiliano
Rodríguez
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 38 de 109

DOCUMENTO CONTROLADO

29. Justificación

Este curso está orientado a profesionales de las distintas ramas de las Ciencias de la salud y corresponde a un
curso de profundización en métodos estadísticos y de machine learning aplicados a la Biología y Medicina. Se
pretende afianzar los conceptos y métodos propios del área de la salud y presentar a los estudiantes un conjunto
de técnicas recientes e innovadoras para el análisis de datos en Salud.

El uso de métodos estadísticos en los distintos campos de estudio requiere de reservas de información o datos
científicos a partir de muestras, que en el campo se salud son enormes, dado el avance en las tecnologías de la
información y la trasformación a la era digital. Estos datos se encuentran almacenados en grandes repositorios,
para ser analizados mediante la apropiada utilización de herramientas analíticas, de tal forma que los métodos
estadísticos se convierten en un componente indispensable en la formación profesional que permite generar
ventajas competitivas en su desempeño profesional.

En tal medida, el curso ofrece a los estudiantes la posibilidad de afianzar sus conocimientos en Biología y
Medicina, y expandir sus aptitudes profesionales, siendo capaces de liderar o apoyar proyectos de investigación
en distintas áreas de la Salud Pública, la Bioestadística y la Medicina.

30. Contenidos Generales

Unidad 1: Introducción a las aplicaciones del machine learning en Ciencias de la salud.


Unidad 2: Aprendizaje no supervisado: análisis de dependencias.
 Análisis en componentes principales
 Análisis de correspondencias múltiples
 Métodos de selección de variables basada en importancia, filtrado y envolturas
Unidad 3: Aprendizaje supervisado: Regresión.
 Árboles para regresión.
 KNN para regresión.
Unidad 4: Aprendizaje supervisado: Clasificación.
 Árboles para clasificación.
 kNN para clasificación.
Unidad 5: Aprendizaje no supervisado: Clustering.
 K-means.
 Hierarchical Clustering.

31. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Profundizarán en los elementos conceptuales y metodológicos que fundamentan la
Biología y la Medicina. Esto implica que serán capaces de: explicar los distintos diseños
Conocimiento de los estudios médicos y biológicos; comprender los distintos métodos de inferencia
fundamental analizados en las ciencias de la salud, comprender distintos modelos probabilísticos
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 39 de 109

DOCUMENTO CONTROLADO

utilizados en estudios clínicos y bilógicos.

Aplicarán adecuadamente métodos de la Bioestadística y del Machine Learning para la


validación de hipótesis médicas y biológicas, mediante la argumentación de los temas
a desarrollar que contribuyan a tomar decisiones en forma acertada en el marco de la
Salud Publica.
Aplicación
Integrarán los conocimientos y habilidades adquiridos en el curso a la solución de
problemas en las Ciencias de la salud, siendo capaces de diseñar, desarrollar o
Integración asesorar proyectos de investigación en Medicina, Biología y/o otras ramas
relacionadas.

El curso permite que los estudiantes interactúen con sus compañeros y docentes, a
través de los distintos escenarios de aprendizaje como talleres, proyectos en grupo y
Dimensión humana demás, esta interacción se da gracias al trato tolerante y respetuoso entre las partes.
Los estudiantes podrán verse a sí mismos como profesionales y seres humanos
capaces de lograr metas y generar soluciones eficientes a las distintas problemáticas
de su área de estudio.

El curso ofrece las bases teóricas y prácticas de los métodos estadísticos y de Machine
Compromiso Learning, de tal forma que se determine su aplicabilidad en el ámbito real, permitiendo
que los estudiantes puedan adquirir un mayor compromiso personal con el aprendizaje
académico de la asignatura y los puedan desarrollar en su vida profesional.
Estarán en capacidad de generar planes de estudio conforme al proceso de aprendizaje
adquirido tanto académica como autónomamente, utilizando adecuadamente fuentes
Aprender a aprender de información y generando nuevas inquietudes en su ámbito profesional.

32. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:

Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.

La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de las ingenierías.

Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de


las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje –oral y escrito- y de las formas de representación que utiliza en la solución de problemas.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 40 de 109

DOCUMENTO CONTROLADO

Según Decreto 808 del 25 de abril del 2002 del MEN. El departamento de matemáticas acoge las siguientes
actividades para cumplir con lo referente al crédito educativo:
Tiempo en clase con el Docente (TCD)
Tiempo de taller en clase (TTC )
Tiempo de trabajo independiente. (TTI)
Lecturas previas a cada tema. (TTI).
Exposiciones del profesor (TCD).
Talleres en clase (TTC).
Resolución de problemas. (TCD, TTC, TTI)
Talleres individuales y grupales. (TTC, TTI).
Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).
Socialización presencial dirigida por el docente, enfocada a la realimentación de las actividades de evaluación
(TCD, TTI).

33. Evaluación y calificación

El proceso de evaluación tiene como propósito la formación integral del estudiante, sobre la base de una ética
que promueva la tolerancia, la solidaridad, la participación democrática, la creatividad y la equidad; tiene como
principio: ser continua, sistemática, interpretativa y formativa. Está acorde con el propósito de la misión
institucional de: “la promoción de la dignidad de la persona humana en su integralidad y el desarrollo de valores
éticos, morales, estéticos, históricos y tecno-científicos”. Este concepto se puede desglosar en tres partes
esenciales.

1. La evaluación es una actividad sistemática, continua: Es decir que se realiza a lo largo del proceso
de formación del alumno, que se basa en toda clase de datos, informes, pruebas, ejercicios, etc. y que se
sistematiza mediante una serie de sesiones o momentos evaluativos, que se suceden durante el curso. El
docente debe propiciar la evaluación formativa como elemento correctivo y facilitador de la autoevaluación por
parte del estudiante, logrando así los objetivos, los alcances propuestos por este y limitando su labor a ayudar,
corregir y orientar.

2. La evaluación está integrada en el proceso educativo. La evaluación no puede ser algo aparte,
secundario, realizado al final del proceso, debe formar parte de cada tema, de cada unidad, de cada actividad.
Debe encontrarse dentro del mismo proceso, dentro de la programación del trabajo en períodos cortos.

3. La evaluación se relaciona directamente con cada uno de los componentes curriculares. Para
reorientar las debilidades y acentuar las fortalezas determinando hasta qué punto se cumplen los objetivos. En
cuanto a la calificación del aprendizaje se tendrán en cuenta: Talleres resueltos en clase, en casa, parciales,
quices, investigación, exposiciones. Para cada tema se desarrollarán talleres, que podrán ser guiados desde la
tutoría o realizados dentro del proceso de la clase.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 41 de 109

DOCUMENTO CONTROLADO

34. Cronograma

Actividades
Actividades
Semana/Sesió Independientes de
Módulo y temas acompañamiento directo
n Aprendizaje:
(Presencial o sincrónica)
Asincrónico
Semana 1 • Análisis en Los estudiantes trabajarán A través de los notebooks
Sesión 1 componentes principales aplicando la técnica en un preparados con un caso de uso
Introducción a conjunto de datos elegidos de epidemiologia se llevarán a
las por ellos mismos. cabo las clases con el fin de
aplicaciones explicar los conceptos de forma
del machine aplicada
learning en
Ciencias de la
salud.

Semana 1  Análisis de Después de las clases Se darán clases presenciales


Sesión 2 correspondencia magistrales los estudiantes para después trabajar
Aprendizaje s múltiples trabajarán conjuntamente con los
no  Métodos de independientemente en los estudiantes en la aplicación de
supervisado: selección de conceptos aprendidos a los conceptos aprendidos.
análisis de variables basada clase.
dependencias: en importancia,
filtrado y
envolturas

Semana 2  Árboles para Se realizarán clases magistrales


Sesión 1 regresión. Los estudiantes aplicarán con los conceptos y fundamentos
Aprendizaje los conceptos aprendidos teóricos para posteriormente
supervisado: en clase para realizar los realizar la aplicación del código
Regresión. ejercicios dejados como en datos de bioestadística.
trabajo autónomo.
Semana 2  KNN para El estudiante aplicará los Con el acompañamiento del
Sesión 2 regresión. conceptos aprendidos en la profesor los estudiantes
Aprendizaje resolución de casos de uso trabajarán en la aplicación y
supervisado: de bioestadística. entendimiento del código de
Regresión. notebook de Jupyter

Semana 3  Árboles para Los estudiantes reforzarán El profesor dará los conceptos y
Sesión 1. clasificación. los conceptos aprendidos en fundamentos teóricos junto con
Aprendizaje clase a través de ejercicios el acompañamiento en la
supervisado: en los que aplicarán el aplicación de los conceptos en
Clasificación. código en datos datos reales.
relacionados en
bioestadística.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 42 de 109

DOCUMENTO CONTROLADO

Semana 3  KNN para Después de la clase el Se brindarán los fundamentos


Sesión 2 clasificación. estudiante aplicará el código teóricos junto con las
Aprendizaje visto en los notebooks de herramientas y el código
supervisado: Jupyter en la resolución de necesario para la aplicación de
Clasificación. casos de uso. KNN para clasificación,

Semana 4  K-means. Los estudiantes aplicarán Se explicará desde el punto de


Sesión 1. los conceptos aprendidos en vista conceptual y práctico el
Aprendizaje clase a través de la concepto, utilidad y aplicación
no aplicación del código en del algoritmo K-means.
supervisado: Jupyter
Clustering.

Semana 4  Hierarchical Los estudiantes reforzarán El profesor explicará los


Sesión 2 Clustering. los conceptos aprendidos en fundamentos teóricos del
clase a través de la Hierarchical Clustring así como
aplicación de los conceptos realizará el acompañamiento en
aprendidos en datos reales. la aplicación del código
implementado de Jupyter.

35. Bibliografía Básica y Complementaria.

7. Cleophas, Ton & Zwinderman, Aeilko. (2020). Machine Learning in Medicine – A Complete Overview.
Springer 10.1007/978-3-030-33970-8.
8. Shmueli, G., Bruce, P. C., Yahav, I., Patel, N. R., & Lichtendahl, K. C. (2018). Data mining for business
analytics: Concepts, techniques, and applications in R.
9. Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani. (2014). An Introduction to
Statistical Learning: with Applications in R. Springer Publishing Company, Incorporated.
10. Shahbaba, Babak. (2012). Biostatistics with R. An Introduction to Statistics through Biological Data.
Springer
11. Pagano, M., Gauvreau, K. (2018). Principles of Biostatistics. New York: Chapman and Hall/CRC,
https://doi.org/10.1201/9780429489624
12. Martín Andrés, Antonio & Luna, JD. (2004). Bioestadística Para Las Ciencias De La Salud. Ediciones
Norma-Capitel
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 43 de 109

DOCUMENTO CONTROLADO

Linea de profundización en
muestreo
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 44 de 109

DOCUMENTO CONTROLADO

Facultad Ciencias
Programa Maestría en Estadística y Ciencia de Datos
Nombre de la Asignatura Muestreo avanzado
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Cristian Tellezcristian@unbosque.edu.co
Tellez
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

36. Justificación

Aunque tremendamente poderoso, el término estrategia de muestreo no ha tenido la trascendencia pertinente


en el mundo del muestreo. Se habla de la eficiencia, precisión e incluso insesgamiento de un estimador sin tener
en cuenta que tales propiedades están ligadas al diseño de muestreo que se haya utilizado en la recolección de
la información. Se debe valorar de igual manera el diseño de muestreo junto con el estimador del parámetro de
interés utilizado en la población finita. Es por lo que, estudiar distintas alternativas de utilizar información auxiliar
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 45 de 109

DOCUMENTO CONTROLADO

e incorporarlas en las estimaciones, se ha vuelto de vital importancia a la hora de proponer estimadores. Esa es
la finalidad de este curso.

El curso pretende desarrollar en el estudiante los criterios estadísticos necesarios para poder decidir qué
estimador es mejor para mejorar las eficiencias de las estimaciones en diseños de muestreo complejos. En este
curso se pretende abordar los siguientes temas:

37. Contenidos Generales

10. Introducción a las técnicas de muestreo basado en el diseño


11. Estimador de Hajék
12. Estimadores GREG
13. Estimadores de media común
14. Estimadores de calibración

38. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes deben tener conocimientos en Probabilidad y Estadística general,
principalmente: Cálculo de probabilidades, intervalos de confianza, distribuciones de
Conocimiento probabilidad, propiedades de los estimadores y cálculo de varianzas y sesgos.
fundamental Adicionalmente, debe tener conocimientos básicos en estadística exploratoria y lógica
de programación, principalmente que tenga conocimientos básicos de programación
en R.
Con el contenido de este curso, el estudiante adquiere habilidades para proponer
diseños de muestreo que permitan realizar estudios de mercado, estudios de política
pública entre otros. Adicional, se pueden realizar encuestas de intención de votos,
medir el crecimiento de la educación de un País, así como los ingresos promedios
Aplicación mensuales de las familias colombianas.
Como bien se mencionó anteriormente, se puede integrar utilizando las técnicas
aprendidas en el curso para poder estimar parámetros tales como promedios,
Integración proporciones, razones, entre otros.
Generar conciencia del manejo adecuado de las herramientas tecnológicas y de las
diversas fuentes de información que se encuentran en la web. Desarrollar la capacidad
Dimensión humana de trabajo en grupo y la habilidad de argumentar las ideas que contribuyan a la
solución de modelos, validando las opiniones de los demás.
Valorar los espacios tanto físicos como académicos que ofrece la
Compromiso universidad para el aprendizaje y Resaltar la importancia del compromiso que debe
tener con su aprendizaje.
Identificar fuentes de información académicas y su correcta utilización. Que
contribuyan a afianzar el conocimiento adquirido en el aula. De manera que el
Aprender a aprender constante aprendizaje se vuelva un hábito en su vida personal y profesional.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 46 de 109

DOCUMENTO CONTROLADO

39. Actividades generales de aprendizaje

El espacio académico busca proporcionar al estudiante las diferentes alternativas metodológicas que ofrecen
los distintos diseños de muestreo para la estimación de los parámetros de interés que podrían presentarse en
su entorno profesional, con esto podrá hacer propuestas estadísticas de diseño de muestreo con el fin de
garantizar inferencias con características óptimas deseables. Este espacio académico se encuentra dentro del
núcleo problémico denominado desde los elementos que aporta al análisis de los Magíster tomasinos, pretende
incorporar los criterios relacionados con la perspectiva propia de la universidad, relacionada con el Humanismo
Tomista, y ser instrumento válido para trabajar en torno al núcleo relacionado con Exclusión Social, Políticas
Públicas, Mercado Y Productividad.

El propósito general del espacio académico es entrenar a los estudiantes en las técnicas de muestreo
probabilístico y estimadores más usadas en la planeación y ejecución de encuestas complejas para la
producción de estadísticas oficiales y proveer las mejores herramientas técnicas para el correcto análisis
estadístico en este tipo de encuestas. En este sentido busca:
 Introducir los conceptos básicos de estimación
 Estimadores de regresión
 Estimadores de calibración
 Muestreo indirecto

40. Evaluación y calificación

 60 %: Talleres y trabajos
 40 %: Un Parcial en físico o en las plataformas virtuales

41. Cronograma (ajustar a 8 sesiones)

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Recordar los diseños Ejercicios Prácticos y teóricos Clases magistrales
muestrales
2. Estimadores de regresión Ejercicios Prácticos y teóricos Clases magistrales
GREG
3 Estimadores de regresión Ejercicios Prácticos y teóricos Clases magistrales
GREG
4 Estimadores de Calibración. Ejercicios Prácticos y teóricos Clases magistrales
Distancia Chi- cuadrado
5 Estimadores de Calibración. Ejercicios Prácticos y teóricos Clases magistrales
Distancia Ranking
6 Ejercicios Prácticos y teóricos Clases magistrales
Muestreo por fases
7 Estimador de diferencia y Ejercicios Prácticos y teóricos Clases magistrales
ajuste por no respuesta
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 47 de 109

DOCUMENTO CONTROLADO

8 Ejercicios Prácticos y teóricos Clases magistrales


Muestreo indirecto

42. Bibliografía Básica y Complementaria

 Särndal, Swensson and Wretman (2003). Model Assited Survey Sampling. Springer.
 Wolter (2007). Introduction to Variance Estimation. Springer.
 Gutiérrez (2013). Estrategias de muestreo: diseño de encuestas y estimación de parámetros.Ediciones
de la U.
 R Development Core Team (2014). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http:
//www.Rproject.org.
 Valliant, Dever and Kreuter (2013). Practical Tools for Designing and Weighting Survey Samples.
Springer.
 Lehtonen and Pahkinen (2004). Practical Methods for Design and Analysis of Complex Surveys. John
Wiley and Sons.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 48 de 109

DOCUMENTO CONTROLADO

Facultad Ciencias
Programa Maestría en Estadística y Ciencia de Datos
Nombre de la Asignatura Muestreo en Poblaciones Biológicas
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) David ramosdavid@unbosque.edu.co
Ramos
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

43. Justificación

Se habla de la eficiencia, precisión e incluso insesgamiento de un estimador sin tener en cuenta que tales
propiedades están ligadas al diseño de muestreo que se haya utilizado en la recolección de la información. Se
debe valorar de igual manera el diseño de muestreo junto con el estimador del parámetro de interés utilizado
en la población finita. Es por lo que, estudiar distintas alternativas de utilizar información auxiliar e incorporarlas
en las estimaciones, se ha vuelto de vital importancia a la hora de proponer estimadores. Esa es la finalidad de
este curso.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 49 de 109

DOCUMENTO CONTROLADO

El muestreo en poblaciones biológicas dispone métodos usados en ecología, en esta asignatura se definirá el
tipo de muestreo, los factores que influyen en la muestra, su cálculo, entre otros.

44. Contenidos Generales

Diseños de muestra para estudios en biología y ecología


Diseño de muestras para estudios epidemiológicos
Análisis de información biológica y ecológica. Análisis poblacional.
Análisis de información biológica y ecológica. Análisis comunitario

45. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes deben tener conocimientos en Probabilidad y Estadística general,
principalmente: Cálculo de probabilidades, intervalos de confianza, distribuciones de
Conocimiento probabilidad, propiedades de los estimadores y cálculo de varianzas y sesgos.
fundamental Adicionalmente, debe tener conocimientos básicos en estadística exploratoria y lógica
de programación, principalmente que tenga conocimientos básicos de programación
en R.
Con el contenido de este curso, el estudiante adquiere habilidades para proponer
diseños de muestreo que permitan realizar estudios de mercado, estudios de política
pública entre otros. Adicional, se pueden realizar encuestas de intención de votos,
medir el crecimiento de la educación de un País, así como los ingresos promedios
Aplicación mensuales de las familias colombianas.
Como bien se mencionó anteriormente, se puede integrar utilizando las técnicas
aprendidas en el curso para poder estimar parámetros tales como promedios,
Integración proporciones, razones, entre otros.
Generar conciencia del manejo adecuado de las herramientas tecnológicas y de las
diversas fuentes de información que se encuentran en la web. Desarrollar la capacidad
Dimensión humana de trabajo en grupo y la habilidad de argumentar las ideas que contribuyan a la
solución de modelos, validando las opiniones de los demás.
Valorar los espacios tanto físicos como académicos que ofrece la
Compromiso universidad para el aprendizaje y Resaltar la importancia del compromiso que debe
tener con su aprendizaje.
Identificar fuentes de información académicas y su correcta utilización. Que
contribuyan a afianzar el conocimiento adquirido en el aula. De manera que el
Aprender a aprender constante aprendizaje se vuelva un hábito en su vida personal y profesional.

46. Actividades generales de aprendizaje


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 50 de 109

DOCUMENTO CONTROLADO

El espacio académico busca proporcionar al estudiante las diferentes alternativas metodológicas que ofrecen
los distintos diseños de muestreo para la estimación de los parámetros de interés que podrían presentarse en
su entorno profesional, con esto podrá hacer propuestas estadísticas de diseño de muestreo con el fin de
garantizar inferencias con características óptimas deseables. Este espacio académico se encuentra dentro del
núcleo problémico denominado desde los elementos que aporta al análisis de los Magíster tomasinos, pretende
incorporar los criterios relacionados con la perspectiva propia de la universidad, relacionada con el Humanismo
Tomista, y ser instrumento válido para trabajar en torno al núcleo relacionado con Exclusión Social, Políticas
Públicas, Mercado Y Productividad.

El propósito general del espacio académico es entrenar a los estudiantes en las técnicas de muestreo
probabilístico y estimadores más usadas en la planeación y ejecución de encuestas complejas para la
producción de estadísticas oficiales y proveer las mejores herramientas técnicas para el correcto análisis
estadístico en este tipo de encuestas. En este sentido busca:
 Introducir los conceptos básicos de estimación
 Estimadores de regresión
 Estimadores de calibración
 Muestreo indirecto

47. Evaluación y calificación

 60 %: Talleres y trabajos
 40 %: Un Parcial en físico o en las plataformas virtuales

48. Cronograma (ajustar a 8 sesiones)

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Recordar los diseños Ejercicios Prácticos y teóricos Clases magistrales
muestrales
2. Muestreo de parcelas: Ejercicios Prácticos y teóricos Clases magistrales
Muestreo de transectos.
Muestreo de intersección de
puntos

3 Diseño de muestras para Ejercicios Prácticos y teóricos Clases magistrales


estudios epidemiológicos:
muestras en estudios
experimentales, muestreo
para cuasi experimentos y
para experimentos clínicos
.
4 Diseño de muestras para Ejercicios Prácticos y teóricos Clases magistrales
estudios epidemiológicos:,
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 51 de 109

DOCUMENTO CONTROLADO

Muestras para estudios


observacionales.

5 Diseño de muestras para Ejercicios Prácticos y teóricos Clases magistrales


estudios epidemiológicos:
estudios de cohorte, estudios
de casos y controles,
estudios de sobrevivencia
6 Análisis de información Ejercicios Prácticos y teóricos Clases magistrales
biológica y ecológica:
Estructura de edad.
5.2 Construcción de tablas de
vida, Crecimiento poblacional.
Dispersión poblacional.
7 Análisis de información Ejercicios Prácticos y teóricos Clases magistrales
biológica y ecológica. Análisis
comunitario: estructura
comunitaria, diversidad de
especies, curvas de
utilización de recursos.

8 Análisis de información Ejercicios Prácticos y teóricos Clases magistrales


biológica y ecológica.
Interacciones biológicas,
Competencia interespecífica,
Depredación, Relaciones
tróficas.

49. Bibliografía Básica y Complementaria

 Särndal, Swensson and Wretman (2003). Model Assited Survey Sampling. Springer.
 Wolter (2007). Introduction to Variance Estimation. Springer.
 Gutiérrez (2013). Estrategias de muestreo: diseño de encuestas y estimación de parámetros.Ediciones
de la U.
 R Development Core Team (2014). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http:
//www.Rproject.org.
 Valliant, Dever and Kreuter (2013). Practical Tools for Designing and Weighting Survey Samples.
Springer.
 Lehtonen and Pahkinen (2004). Practical Methods for Design and Analysis of Complex Surveys. John
Wiley and Sons.
 Begon; Harper & Townsend, Ecología : individuos, poblaciones y comunidades. Omega, Barcelona.
1988.
 Bryan F. J. Manly. Lyman L. McDonald, and Dana L. Thomas. Resource Selection by
 animals: Statistical Design and analysis, Simposio de Estadística, 2000
 Buckland, Anderson, Burnham, Introduction to Distance Sampling: Estimating Abundance of
Biological Populations, Oxford, 2001.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 52 de 109

DOCUMENTO CONTROLADO
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 53 de 109

DOCUMENTO CONTROLADO

Facultad Ciencias
Programa Maestría en Estadística y Ciencia de Datos
Nombre de la Asignatura Estimación en áreas pequeñas
Cuatrim
Código de la Asignatura Periodo Académico
estre 3
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Cristian Tellezcristian@unbosque.edu.co
Téllez
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

50. Justificación

La estimación en áreas pequeñas hace referencia a la estimación para dominios que tienen un tamaño de
muestra efectivo relativamente pequeño. Se basa el ajuste de modelos mixtos, que toman en cuenta las
variaciones existentes dentro de cada dominio (área pequeña). Se aumenta la información disponible en el
área pequeña, integrando la información provista por variables auxiliares, este aumento de información viene
acompañado de una disminución en el error de muestreo y una mejora sustancial en la calidad de las
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 54 de 109

DOCUMENTO CONTROLADO

estimaciones. Existen dos familias de modelos: los Modelos a nivel de área (Fay – Herriot) y los modelos a
nivel de individuo (Battese - Harter – Fuller, entre otros).

Se espera que en este espacio académico el estudiante está en la capacidad de obtener estimaciones
desagregadas que son imposibles de obtener por las metodologías tradicionales de muestreo, dichas
estimaciones se requieren en diferentes áreas como el marketing, en el sector público, el sector salud, y diversos
estudios socioeconómicos.

51. Contenidos Generales

En términos generales, los contenidos del curso son:

1. Estimación directa en dominios


2. Estimación Sintética
3. Estimadores compuestos
4. Estimaciones basadas en modelos de unidad
5. Estimaciones basadas en modelos de áreas

52. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes deben tener conocimientos en Probabilidad y Estadística general,
principalmente: Cálculo de probabilidades, intervalos de confianza, distribuciones de
Conocimiento probabilidad, propiedades de los estimadores y cálculo de varianzas y sesgos.
fundamental Adicionalmente, debe tener conocimientos básicos en estadística exploratoria y lógica
de programación, principalmente que tenga conocimientos básicos de programación
en R.
Con el contenido de este curso, el estudiante adquiere habilidades para proponer
diseños de muestreo que permitan realizar estudios de mercado, estudios de política
pública entre otros. Adicional, se pueden realizar encuestas de intención de votos,
medir el crecimiento de la educación de un País, así como los ingresos promedios
Aplicación mensuales de las familias colombianas.
Como bien se mencionó anteriormente, se puede integrar utilizando las técnicas
aprendidas en el curso para poder estimar parámetros tales como promedios,
Integración proporciones, razones, entre otros.
Generar conciencia del manejo adecuado de las herramientas tecnológicas y de las
diversas fuentes de información que se encuentran en la web. Desarrollar la capacidad
Dimensión humana de trabajo en grupo y la habilidad de argumentar las ideas que contribuyan a la
solución de modelos, validando las opiniones de los demás.
Valorar los espacios tanto físicos como académicos que ofrece la
Compromiso universidad para el aprendizaje y Resaltar la importancia del compromiso que debe
tener con su aprendizaje.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 55 de 109

DOCUMENTO CONTROLADO

Identificar fuentes de información académicas y su correcta utilización. Que


contribuyan a afianzar el conocimiento adquirido en el aula. De manera que el
Aprender a aprender constante aprendizaje se vuelva un hábito en su vida personal y profesional.

53. Actividades generales de aprendizaje

El espacio académico busca proporcionar al estudiante las diferentes alternativas metodológicas que ofrecen
los distintos diseños de muestreo y la estimación en áreas pequeñas. El propósito general del espacio académico
es entrenar a los estudiantes en las técnicas de estimación en áreas pequeñas más usadas en la planeación y
ejecución de encuestas complejas para la producción de estadísticas oficiales y proveer las mejores
herramientas técnicas para el correcto análisis estadístico en este tipo de encuestas. En este sentido busca
que:
1. ¿El estudiante comprende los principios de los estimadores directos para estimadores de áreas
pequeñas?
2. ¿El estudiante hace uso de modelos de estimación de áreas pequeñas a nivel de área y unidad?
3. ¿El estudiante conoce la integración existente entre los modelos lineales y el muestreo para mejorar
la precisión de las estimaciones muestrales a nivel de áreas pequeñas?
4. ¿El estudiante hace uso de software especializado para obtener estimaciones y medidas de
incertidumbre para estimaciones de áreas pequeñas?

54. Evaluación y calificación

 60 %: Talleres y trabajos
 40 %: Un Parcial en físico o en las plataformas virtuales

55. Cronograma (ajustar a 8 sesiones)

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Presentación del curso – Ejercicios Prácticos y teóricos Clases magistrales
Introducción, conceptos
básicos, Notación. Y ejemplos
de aplicación.
2. Estimadores directos para Ejercicios Prácticos y teóricos Clases magistrales
dominios.
3 Estimadores Generalizados de Ejercicios Prácticos y teóricos Clases magistrales
regresión y casos particulares
(Estimador de razón, pos
estratificado, GREG)
4 Estimador sintético, Ejercicios Prácticos y teóricos Clases magistrales
estimador compuesto.
Comparación con los
estimadores tradicionales.
Bootsrapping. Teoría de la
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 56 de 109

DOCUMENTO CONTROLADO

predicción bajo el modelo


lineal
5 Estimador compuesto. Ejercicios Prácticos y teóricos Clases magistrales
Varianza Jackknife
6 Predictor BLU de la media de Ejercicios Prácticos y teóricos Clases magistrales
un área pequeña, Predictor
BLU de una observación,
Predictores BLUP de la media
de un área pequeña. Cálculo
del error cuadrático medio al
predecir, El MSE en modelos
lineales mixtos
7 Predicción lineal óptima en Ejercicios Prácticos y teóricos Clases magistrales
modelos lineales mixtos.
Modelo de Fay – Herriot y
aplicaciones
8 Ejercicios Prácticos y teóricos Clases magistrales
Modelos de área.

56. Bibliografía Básica y Complementaria

 Rao, J.N.K., Molina. (2015). Small Area Estimation. Wiley


 Särndal, Swensson and Wretman (2003). Model Assited Survey Sampling. Springer.
 Wolter (2007). Introduction to Variance Estimation. Springer.
 Gutiérrez (2013). Estrategias de muestreo: diseño de encuestas y estimación de parámetros.Ediciones
de la U.
 Valliant, Dever and Kreuter (2013). Practical Tools for Designing and Weighting Survey Samples.
Springer.
 Lehtonen and Pahkinen (2004). Practical Methods for Design and Analysis of Complex Surveys. John
Wiley and Sons.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 57 de 109

DOCUMENTO CONTROLADO

Linea de profundización en Ciencia


de Datos
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 58 de 109

DOCUMENTO CONTROLADO

Facultad FACULTAD DE CIENCIAS


Programa MAESTRIA EN ESTADISTICA Y CIENCIAS DE DATOS
Nombre de la Asignatura MACHINE LEARNING II
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 40 sincrónicas /periodo
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 80

EQUIPO DOCENTE

Horario Espacio
Nombre Correo Electrónico Atención A de
Estudiantes atención a
(Día – Hora) estudiantes
Coordinador(es) Ricardo Borda bordaricardo@unbosque.edu.co

Docente(s) Carlos cpuentesm@unbosque.edu.co


Alberto
Puentes
Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 59 de 109

DOCUMENTO CONTROLADO

El éxito empresarial hoy en día se debe a la gran cantidad de datos que se posean, su transformación y las
decisiones que se puedan tomar basadas en estos. En este contexto, las empresas son conscientes hoy en día
de la importancia de los datos y, por lo tanto, están elaborando medidas estratégicas y operacionales que
permitirán adquirir las aptitudes y los conocimientos necesarios para lograr nuevos beneficios analíticos basados
en nuevos datos de gran tamaño junto con metodologías para tratamiento de información como el aprendizaje
automático de forma supervisada, no supervisada, semi-supervisada o reforzada.

Aporte al proyecto educativo institucional y del programa: La Universidad El Bosque, sigue


reconociendo en su Plan de Desarrollo Institucional 2016-2021 la importancia y la decisión de promover la
formación integral desde su enfoque bio-psico-social y cultural. De allí que se pueda ver en el Plan de
Desarrollo institucional los compromisos adquiridos en términos de “realizar ajustes en la denominación, en los
componentes curriculares, en la intensificación de las prácticas bajo la filosofía del aprender haciendo, donde a
través de esta asignatura se mostrará la importancia de la ejecución de proyectos académicos bajo el
andamiaje teórico matemático-estadístico-algorítmico para llevar a cabo la adquisición de las competencias de
un científico de datos.

2. Contenidos Generales

1. Introducción al aprendizaje no supervisado y reforzado.


2. Modelos Gaussianos mixtos y Manifold Learning.
3. Clustering con K-Means.
4. Análisis de Componentes principales y Análisis de componentes independientes
5. Detección de Anomalías
6. Redes neuronales sin supervisión, Máquinas de Bolzmann
7. Aprendizaje Reforzado, Método Monte Carlo y Q Learning

3. Objetivos de aprendizaje

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Comprender críticamente y argumentar los fundamentos teóricos, conceptuales y
Conocimiento metodológicos del aprendizaje de maquina desde su enfoque no supervisado y
fundamental reforzado, reconociendo el objetivo y el alcance de los mismos, marcos de
referencia y/o buenas prácticas, Identificando fortalezas y debilidades a la hora de
implementarlos en un proyecto.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 60 de 109

DOCUMENTO CONTROLADO
Expresar un pensamiento crítico y creativo hacia el conocimiento de los procesos
metodológicos de los algoritmos de aprendizaje no supervisado y reforzado,
evaluando su eficacia e idoneidad para la ejecución de proyectos.
Aplicación
Diseñar soluciones desde el pensamiento práctico fundamentadas en casos
específicos, evaluando su validez en términos de los requerimientos funcionales
del caso en mención.

Identificar, analizar, comprender y relacionar los conceptos fundamentales en


Integración términos teóricos y algorítmicos del aprendizaje de máquina, tanto en sus
propios campos de acción como con otras áreas del conocimiento.

Reconocer la importancia del procesamiento de los datos para el aprendizaje de


Dimensión humana máquina y las relaciones con su entorno.

Colaborar y cooperar con otros profesionales, del campo de estadística,


matemática y ciencias de datos, o de otras disciplinas, de manera que
contribuya bajo criterios éticos en la toma de decisiones y el desarrollo exitoso
de los programas en los que se vea involucrado.

Gestionar cambios metodológicos a partir de su saber y hacer personal,


Compromiso disciplinario y profesional, fundamentado en los procesos de aprendizaje de
maquina en su enfoque no supervisado y reforzado y sus relaciones en pro de
la responsabilidad social y empresarial que le rodea.

Evalúa y potencializa sus habilidades para indagar e investigar acerca de las


Aprender a aprender nuevas tendencias, enfoques, metodologías y buenas prácticas necesarias al
momento de abordar un proyecto con aprendizaje de máquinas.

4. Actividades generales de aprendizaje

La estrategia pedagógica que se trabajara a lo largo del curso es Aprendizaje Basado en Proyectos. Es
una metodología en la que se investiga, interpreta, argumenta y propone la solución a uno o varios
proyectos, creando un escenario simulado de posible solución y analizando las probables consecuencias
(Pimienta, 2012).

Para este tipo de asignaturas de naturaleza teórica y practica es fundamental tener en cuenta que los
medios educativos necesarios para las sesiones presenciales son: una sala de informática y una cuenta
de correo institucional para el desarrollo los laboratorios.

Referencia:

Pimienta, J (2012). Estrategias de enseñanza-aprendizaje. Editorial Pearson, México.

Relación de la Estrategia Pedagógica con las actividades:

La estrategia pedagógica se encuentra dividida en dos etapas:


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 61 de 109

DOCUMENTO CONTROLADO

- Etapa de conceptualización, esta etapa dura 8 semanas durante este espacio de tiempo los
estudiantes realizarán lecturas guiadas con el objetivo de comprender la base teórica del aprendizaje
de maquina en su enfoque no supervisado y reforzado.

- Etapa de solución de ejercicios prácticos o análisis de casos, paralelamente a la etapa de


conceptualización esta etapa dura también 8 semanas durante este espacio de tiempo los
estudiantes presentarán soluciones a través de entregables para retroalimentación del docente.

Al finalizar la asignatura el estudiante entregará una implementación de un proyecto propio basado en el


aprendizaje de maquina bajo el enfoque no supervisado y reforzado.

5. Evaluación y calificación

Nombre Actividad de Aprendizaje / de Calificación (


Semana Temas
Evaluación % del 100%)
Evaluación Anticipatoria
Taller de Ejercicios de Modelos
1 Introducción a la asignatura 5%
Gaussianos mixtos e inferencia
variacional.
Taller de Ejercicios de Clustering; K-
Means Speactral clustering, DBSCAN 10%

2 Unidad 1 Taller de Ejercicios de Factorización


Matricial, Análisis de Componentes
5%
principales y Análisis de componentes
independientes

Taller de ejercicios de Estimación de


3 5%
covarianza, empírica, reducida e inversa
Unidad 2

. Taller de ejercicios de Detección de


4 Anomalías, valores atípicos y valor 5%
atípico local.

Taller de ejercicios de Estimador de


5 5%
Densidad con Haversine.
Unidad 3
Taller de ejercicios Redes neuronales
6 sin supervisión a través de Máquinas de 5%
Bolzmann restringidas.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 62 de 109

DOCUMENTO CONTROLADO

Taller de ejercicios de Aprendizaje


7 5%
Reforzado, Método Monte Carlo.
Entrega Trabajo Final 50%
Socialización Trabajo Final
Auto y coevaluación Autoevaluación (Obligatoria en línea 3%
8 Asincrónica)

Refuerzo y Retroalimentación Evaluación del Curso. 2%

Total del Porcentaje 100%

6. Cronograma

Actividades
Seman Actividades
acompañamiento
a/Sesió Módulo y temas Independientes de
directo (Presencial o
n Aprendizaje: Asincrónico
sincrónica)
1. Módulo 1. Presentación del Presentación de los tema Exposición del docente y
Curso, contenidos usando las TIC ejercicios en tiempo real
programáticos, acuerdos Entrega del material de
generales, cronograma de trabajo para el semestre,
prueba diagnóstica.
actividades, aplicación de Lectura previa capítulo 2
prueba diagnóstica y de Isoni y Lectura previa
retroalimentación. capítulo 5 de Vander
Introducción al aprendizaje
no supervisado y reforzado.
Tema 1. Aprendizaje No
Supervisado, Modelos
Gaussianos mixtos e
inferencia variacional.
2. Tema 2. Clustering; K- Lectura previa capítulo 5 de Exposición del docente y
Means Speactral clustering, Vander y https://scikit- ejercicios en tiempo real
DBSCAN, Factorización learn.org/stable/modules/mani
Matricial, Análisis de fold.html, Lectura previa
Componentes principales y capítulo 8 de Dangeti y Lectura
Análisis de componentes previa capítulo 2 de Isoni.
independientes https://scikit-
learn.org/stable/modules/deco
mposition.html#factor-analysis
3. Módulo 2. Lectura previa capítulo 5 de Presentación del proyecto de
Tema 1. Estimación de Vander investigación
covarianza, empírica,
reducida e inversa.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 63 de 109

DOCUMENTO CONTROLADO

4. Tema 2. Detección de Lectura previa capítulo 9 de Exposición del docente y


Anomalías, valores atípicos y Zocca ejercicios en tiempo real
valor atípico local.
5. Módulo 3. Lectura previa capítulo 5 de Exposición del docente y
Tema 1. Estimador de Vander ejercicios en tiempo real
Densidad con Haversine.
6. Tema 2. Redes neuronales Exposición del docente y
sin supervisión a través de Lectura previa capítulo 7 de ejercicios en tiempo real
Máquinas de Bolzmann Gulli y Lectura previa capítulo 4
restringidas de Zocca
Tema 3. Sistemas de Lectura previa capítulo 5 de
recomendación, filtros Isoni.
colaborativos y sistemas
híbridos.
7. Tema 4. Aprendizaje Lectura previa capítulo 9 de Exposición del docente y
Reforzado, Método Monte Dangeti y Lectura previa ejercicios en tiempo real
Carlo y Método diferencia capítulo 12 de Gollapudi.
temporal y Q-Learning. Lectura previa capítulo 9 de
Dangeti y Lectura previa
capítulo 12 de Gollapudi
8. Tutoría de proyecto de Presentación parcial del Socialización docente y
Investigación proyecto. estudiante

7. Bibliografía Básica y Complementaria

Vander, J. (2016). Python data science handbook, O’Reilly

Dangeti, P. (2017). Statistics for Machine Learning. Packt Publishing.

Bibliografía Complementaria

Gulli, A. (2017). Deep Learning with Keras. Packt Publishing.

Zocca, V., Spacagna, G., Slater, D., & Roelants, P. (2017). Python Deep Learning. Packt Publishing.

Gollapudi, S., & Laxmikanth, V. (2016). Practical Machine Learning. Packt Publishing.

Matthes E., (2015), Python Crash Course: A Hands-On, Project-Based Introduction to


Programming, ISBN-10: 1593276036, ISBN-13: 978- 1593276034.

Goodfellow I., Bengio Y., Courville A., (2016) Deep Learning (Adaptive Computation and Machine
Learning series), Publisher: The MIT Press, , ISBN-10: 0262035618, ISBN-13: 978-0262035613.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 64 de 109

DOCUMENTO CONTROLADO

Deng L., Yu D., (2013), Deep Learning: Methods and Applications (PDF). Foundations and Trends in Signal
Processing. 7 (3–4), pp. 197-387, DOI: 10.1561/2000000039.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 65 de 109

DOCUMENTO CONTROLADO

Facultad FACULTAD DE CIENCIAS


Programa MAESTRIA EN ESTADISTICA Y CIENCIAS DE DATOS
Nombre de la Asignatura DEEP LEARNING II
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 40 sincrónicas /periodo
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 80

EQUIPO DOCENTE

Horario Espacio
Nombre Correo Electrónico Atención A de
Estudiantes atención a
(Día – Hora) estudiantes
Coordinador(es) Ricardo Borda

Docente(s) Carlos cpuentesm@unbosque.edu.co


Alberto
Puentes
Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 66 de 109

DOCUMENTO CONTROLADO

En la mayoría de proyectos en los cuales un científico de datos emprende o colabora, debe saber solucionar
problemas que se plantean dentro del mismo proyecto, haciendo uso eficiente del razonamiento matemático y
estadístico en sinergia con los algoritmos a implementar, a fin de presentar soluciones concretas y sustentables en
el tiempo. Por lo tanto, todo científico de datos debe poseer herramientas matemáticas y estadísticas para resolver
problemas a través de algoritmos sofisticados de aprendizaje profundo de maquina con alta precisión y aplicación
en el sector salud, banca, gobierno u otros, aprovechando al máximo la capacidad de cómputo de los ordenadores
o en su defecto máquinas virtuales montadas en servidores en la nube, para llevar a cabo dichos proyectos de
forma eficiente.

Aporte al proyecto educativo institucional y del programa: La Universidad El Bosque, sigue


reconociendo en su Plan de Desarrollo Institucional 2016-2021 la importancia y la decisión de promover la
formación integral desde su enfoque bio-psico-social y cultural. De allí que se pueda ver en el Plan de
Desarrollo institucional los compromisos adquiridos en términos de “realizar ajustes en la denominación, en los
componentes curriculares, en la intensificación de las prácticas bajo la filosofía del aprender haciendo, donde a
través de esta asignatura se mostrará la importancia de la ejecución de proyectos académicos bajo el
andamiaje teórico matemático-estadístico-algorítmico para llevar a cabo la adquisición de las competencias de
un científico de datos.

2. Contenidos Generales

1. Introducción a la visión computacional y procesamiento de lenguaje natural.


2. Identificación de Objetos y rostros con arquitecturas AlexNet, GoogleNet, VGGNet, ResNet, InceptionNet,
DenseNet y LeNet de Tensorflow
3. Segmentación de Objetos con DeepLab, RefineNet, Fully Convolutional Networks
4. Reconocimiento óptico de caracteres, machine traslation
5. Generación de Lenguaje Natural para Question Aswering
6. Análisis de semántico de Texto, Análisis de Sentimientos.
7. Speech Recognition.

3. Objetivos de aprendizaje

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Comprender críticamente y argumentar los fundamentos teóricos, conceptuales y
Conocimiento metodológicos del aprendizaje automático profundo para visión de maquina o
fundamental procesamiento de lenguaje natural, reconociendo el objetivo y el alcance de los
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 67 de 109

DOCUMENTO CONTROLADO
mismos, marcos de referencia y/o buenas prácticas, Identificando fortalezas y
debilidades a la hora de implementarlos en un proyecto.

Expresar un pensamiento crítico y creativo hacia el conocimiento de los procesos


metodológicos de los algoritmos de aprendizaje automático profundo para visión de
maquina o procesamiento de lenguaje natural, evaluando su eficacia e idoneidad
Aplicación para la ejecución de proyectos.
Diseñar soluciones desde el pensamiento práctico fundamentadas en casos
específicos, evaluando su validez en términos de los requerimientos funcionales
del caso en mención.

Identificar, analizar, comprender y relacionar los conceptos fundamentales en


Integración términos teóricos y algorítmicos del aprendizaje profundo de máquina, tanto
en sus propios campos de acción como con otras áreas del conocimiento.

Reconocer la importancia del procesamiento de los datos para el aprendizaje de


Dimensión humana máquina y las relaciones con su entorno.

Colaborar y cooperar con otros profesionales, del campo de estadística,


matemática y ciencias de datos, o de otras disciplinas, de manera que
contribuya bajo criterios éticos en la toma de decisiones y el desarrollo exitoso
de los programas en los que se vea involucrado.

Gestionar cambios metodológicos a partir de su saber y hacer personal,


Compromiso disciplinario y profesional, fundamentado en los procesos de aprendizaje
automático profundo para visión de maquina o procesamiento de lenguaje natural
y sus relaciones en pro de la responsabilidad social y empresarial que le rodea.

Evalúa y potencializa sus habilidades para indagar e investigar acerca de las


Aprender a aprender nuevas tendencias, enfoques, metodologías y buenas prácticas necesarias al
momento de abordar un proyecto con aprendizaje de máquinas.

4. Actividades generales de aprendizaje


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 68 de 109

DOCUMENTO CONTROLADO

La estrategia pedagógica que se trabajara a lo largo del curso es Aprendizaje Basado en Proyectos. Es
una metodología en la que se investiga, interpreta, argumenta y propone la solución a uno o varios
proyectos, creando un escenario simulado de posible solución y analizando las probables consecuencias
(Pimienta, 2012).

Para este tipo de asignaturas de naturaleza teórica y práctica es fundamental tener en cuenta que los
medios educativos necesarios para las sesiones presenciales son: una sala de informática y una cuenta
de correo institucional para el desarrollo los laboratorios.

Referencia:

Pimienta, J (2012). Estrategias de enseñanza-aprendizaje. Editorial Pearson, México.

Relación de la Estrategia Pedagógica con las actividades:

La estrategia pedagógica se encuentra dividida en dos etapas:

- Etapa de conceptualización, esta etapa dura 8 semanas durante este espacio de tiempo los
estudiantes realizarán lecturas guiadas con el objetivo de comprender la base teórica del aprendizaje
automático profundo para visión de maquina o procesamiento de lenguaje natural.

- Etapa de solución de ejercicios prácticos o análisis de casos, paralelamente a la etapa de


conceptualización esta etapa dura también 8 semanas durante este espacio de tiempo los
estudiantes presentarán soluciones a través de entregables para retroalimentación del docente.

Al finalizar la asignatura el estudiante entregará una implementación de un proyecto propio basado en el


aprendizaje automático profundo para visión de maquina o procesamiento de lenguaje natural.

5. Evaluación y calificación

Nombre Actividad de Aprendizaje / de Calificación (


Semana Temas
Evaluación % del 100%)
Evaluación Anticipatoria
Taller de Ejercicios de Identificación de
1 Introducción a la asignatura 5%
Objetos y rostros con topologías
AlexNet, GoogleNet, VGGNet,
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 69 de 109

DOCUMENTO CONTROLADO

Taller de Ejercicios de Identificación de


Objetos y rostros con topologías
2 Unidad 1 10%
ResNet, InceptionNet, DenseNet y
LeNet de Tensorflow.

Taller de Ejercicios de Segmentación de


3 Objetos con DeepLab, RefineNet, Fully
Unidad 2 Convolutional Networks.
10%
Taller de Ejercicios de detección de
4 Objetos con R-CNN, Fast R-CNN, R-
FCN, YOLO y SSD.
Taller de ejercicios de Reconocimiento
5%
óptico de caracteres, machine traslation
5 Taller de ejercicios de Generación de
Lenguaje Natural para Question 5%
Aswering
Unidad 3 Taller de ejercicios de Análisis de
6 semántico de Texto, Análisis de 5%
Sentimientos.
Taller de ejercicios de Speech
7 5%
Recognition.
Entrega Trabajo Final 50%
Socialización Trabajo Final
Auto y coevaluación Autoevaluación (Obligatoria en línea 3%
8 Asincrónica)

Refuerzo y Retroalimentación Evaluación del Curso. 2%

Total del Porcentaje 100%

6. Cronograma

Actividades
Seman Actividades
acompañamiento
a/Sesió Módulo y temas Independientes de
directo (Presencial o
n Aprendizaje: Asincrónico
sincrónica)
1 Módulo 1. Presentación del Presentación de los tema Exposición del docente.
Curso, contenidos usando las TIC
programáticos, acuerdos Entrega del material de
generales, cronograma de trabajo para el semestre,
prueba diagnóstica.
actividades, aplicación de
prueba diagnóstica y
retroalimentación.
Introducción a Visión
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 70 de 109

DOCUMENTO CONTROLADO

Computacional y
Procesamiento de Lenguaje
Natural.
Tema 1. Identificación de Lectura previa capítulo 3 de Exposición del docente y
Objetos con AlexNet y Gulli ejercicios en tiempo real
GoogleNet
2 Tema 2. VGGNet, ResNet e Lectura previa capítulo 3 de Exposición del docente y
InceptionNet Gulli ejercicios en tiempo real
Tema 3. DenseNet y LeNet Lectura previa capítulo 3 de Presentación del proyecto de
Gulli investigación
3 Módulo 2. Lectura previa capítulo 2, 4, 6 y Exposición del docente y
Tema 1. Detección y análisis 8 de Shanmugamani y Lectura ejercicios en tiempo real
de Emoción, Reconstrucción previa capítulo 7 de Bakker.
de Escenas y
Reconocimiento de Objetos.
Tema 2 Segmentación de Lectura previa capítulo 5 de Exposición del docente y
Objetos con DeepLab, Shanmugamani y Lectura ejercicios en tiempo real
RefineNet, Fully previa capítulo 7 de Dadhich
Convolutional Networks,
4 Tema 3. Lectura previa capítulo 6 de Exposición del docente y
U-Net Conditional Random Shanmugamani y Lectura ejercicios en tiempo real
Field, SegNet y PSPNet. previa capítulo 3 de Dadhich
Tema 4. Detección de Lectura previa capítulo 7 de Presentación del proyecto de
Objetos con R-CNN, Fast R- Shanmugamani y Lectura investigación
CNN, R-FCN, YOLO y SSD. previa capítulo 6 de Dadhich
Módulo 3. Lectura previa capítulo 6 de Exposición del docente y
Tema 1. NPL, Zocca, Lectura previa capítulo 7 ejercicios en tiempo real
Reconocimiento óptico de de Shanmugamani y Lectura
caracteres, machine previa capítulo 8 de Bakker.
traslation
5 Tema 2. Parsing, Tagging, Lectura previa capítulo 6 de Exposición del docente y
Reconocimiento de entidades Zocca y Lectura previa capítulo ejercicios en tiempo real
nombradas 7 de Shanmugamani
Tema 3. Generación de Lectura previa capítulo 8 de Exposición del docente y
Lenguaje Natural para Bakker. ejercicios en tiempo real
Question Aswering
6 Tema 4. Análisis de Lectura previa capítulo 8 de Exposición del docente y
semántico de Texto, Análisis Raschka y Lectura previa ejercicios en tiempo real
de Sentimientos. módulo 3-capítulo 6 y 7 de
Hardeniya
7 Tema 5. Speech Lectura previa capítulo 9 de Exposición del docente y
Recognition Bakker y Lectura previa ejercicios en tiempo real
capítulo 12 de Joshi
Tema 6. Text- to- Speech Lectura previa capítulo 9 de Exposición del docente y
Bakker. ejercicios en tiempo real
8 Parcial. Proyecto de Entrega del proyecto. Presentación del proyecto de
Investigación investigación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 71 de 109

DOCUMENTO CONTROLADO

7. Bibliografía Básica y Complementaria

Gulli, A. (2017). Deep Learning with Keras. Packt Publishing.

Shanmugamani, R. (2018). Deep Learning for Computer Vision : Expert Techniques to Train Advanced
Neural Networks Using TensorFlow and Keras. Packt Publishing.

Bibliografía Complementaria

Bakker, I. den. (2017). Python Deep Learning Cookbook. Packt Publishing.

Dadhich, A. (2018). Practical Computer Vision : Extract Insightful Information From Images Using
TensorFlow, Keras, and OpenCV. Packt Publishing

Goodfellow I., Bengio Y., Courville A., (2016) Deep Learning (Adaptive Computation and Machine
Learning series), Publisher: The MIT Press, , ISBN-10: 0262035618, ISBN-13: 978-0262035613.

Hardeniya, N. (2016). Natural Language Processing: Python and NLTK. Packt Publishing.

Joshi, P. (2017). Artificial Intelligence with Python. Packt Publishing.

Karim, M. R. (2017). Predictive Analytics with TensorFlow. Packt Publishing.


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 72 de 109

DOCUMENTO CONTROLADO

Facultad FACULTAD DE CIENCIAS


Programa MAESTRIA EN ESTADISTICA Y CIENCIAS DE DATOS
Nombre de la Asignatura Architecting with Google Compute Engine
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 40 sincrónicas /periodo
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 80

EQUIPO DOCENTE

Horario Espacio
Nombre Correo Electrónico Atención A de
Estudiantes atención a
(Día – Hora) estudiantes
Coordinador(es) Ricardo Borda bordaricardo@unbosque.edu.co

Docente(s) Carlos cpuentesm@unbosque.edu.co


Alberto
Puentes
Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 73 de 109

DOCUMENTO CONTROLADO

El éxito empresarial hoy en día se debe a la gran cantidad de datos que se posean, su transformación y las
decisiones que se puedan tomar basadas en estos. En este contexto, las empresas son conscientes hoy en día
de la importancia de los datos y, por lo tanto, están elaborando medidas estratégicas y operacionales que
permitirán adquirir las aptitudes y los conocimientos necesarios para lograr nuevos beneficios analíticos basados
en nuevos datos de gran tamaño junto con metodologías para tratamiento de información como el aprendizaje
automático y su puesta en producción.

Aporte al proyecto educativo institucional y del programa: La Universidad El Bosque, sigue


reconociendo en su Plan de Desarrollo Institucional 2016-2021 la importancia y la decisión de promover la
formación integral desde su enfoque bio-psico-social y cultural. De allí que se pueda ver en el Plan de
Desarrollo institucional los compromisos adquiridos en términos de “realizar ajustes en la denominación, en los
componentes curriculares, en la intensificación de las prácticas bajo la filosofía del aprender haciendo, donde a
través de esta asignatura se mostrará la importancia de la ejecución de proyectos académicos bajo el
andamiaje teórico matemático-estadístico-algorítmico para llevar a cabo la adquisición de las competencias de
un científico de datos.

2. Contenidos Generales

1. Explorando y preparando sus datos con BigQuery


2. Creando nuevos conjuntos de datos de BigQuery y visualización
3. Conocimientos avanzados con BigQuery en GCP
4. Aplicando Machine Learning a sus datos con GCP
5. Puesta en producción de los modelos de Machine Learning en un servicio Web

3. Objetivos de aprendizaje

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Comprender críticamente y argumentar los fundamentos teóricos, conceptuales y
Conocimiento metodológicos del aprendizaje de maquina y su puesta en producción,
fundamental reconociendo el objetivo y el alcance de los mismos, marcos de referencia y/o
buenas prácticas, Identificando fortalezas y debilidades a la hora de
implementarlos en un proyecto.

Expresar un pensamiento crítico y creativo hacia el conocimiento de los procesos


metodológicos de los algoritmos de aprendizaje y su puesta en producción,
evaluando su eficacia e idoneidad para la ejecución de proyectos.
Aplicación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 74 de 109

DOCUMENTO CONTROLADO

Diseñar soluciones desde el pensamiento práctico fundamentadas en casos


específicos, evaluando su validez en términos de los requerimientos funcionales
del caso en mención.

Identificar, analizar, comprender y relacionar los conceptos fundamentales en


Integración términos teóricos y algorítmicos del aprendizaje de máquina, tanto en sus
propios campos de acción como con otras áreas del conocimiento.

Reconocer la importancia del procesamiento de los datos para el aprendizaje de


Dimensión humana máquina y las relaciones con su entorno.

Colaborar y cooperar con otros profesionales, del campo de estadística,


matemática y ciencias de datos, o de otras disciplinas, de manera que
contribuya bajo criterios éticos en la toma de decisiones y el desarrollo exitoso
de los programas en los que se vea involucrado.

Gestionar cambios metodológicos a partir de su saber y hacer personal,


Compromiso disciplinario y profesional, fundamentado en los procesos de aprendizaje de y
su puesta en producción y sus relaciones en pro de la responsabilidad social y
empresarial que le rodea.

Evalúa y potencializa sus habilidades para indagar e investigar acerca de las


Aprender a aprender nuevas tendencias, enfoques, metodologías y buenas prácticas necesarias al
momento de abordar un proyecto con aprendizaje de máquinas.

4. Actividades generales de aprendizaje

La estrategia pedagógica que se trabajara a lo largo del curso es Aprendizaje Basado en Proyectos. Es
una metodología en la que se investiga, interpreta, argumenta y propone la solución a uno o varios
proyectos, creando un escenario simulado de posible solución y analizando las probables consecuencias
(Pimienta, 2012).

Para este tipo de asignaturas de naturaleza teórica y práctica es fundamental tener en cuenta que los
medios educativos necesarios para las sesiones presenciales son: una sala de informática y una cuenta
de correo institucional para el desarrollo los laboratorios.

Referencia:

Pimienta, J (2012). Estrategias de enseñanza-aprendizaje. Editorial Pearson, México.

Relación de la Estrategia Pedagógica con las actividades:

La estrategia pedagógica se encuentra dividida en dos etapas:

- Etapa de conceptualización, esta etapa dura 8 semanas durante este espacio de tiempo los
estudiantes realizarán lecturas guiadas con el objetivo de comprender la base teórica del aprendizaje
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 75 de 109

DOCUMENTO CONTROLADO

de máquina y su puesta en producción.

- Etapa de solución de ejercicios prácticos o análisis de casos, paralelamente a la etapa de


conceptualización esta etapa dura también 8 semanas durante este espacio de tiempo los
estudiantes presentarán soluciones a través de entregables para retroalimentación del docente.

Al finalizar la asignatura el estudiante entregará una implementación de un proyecto propio basado en el


aprendizaje de maquina y su puesta en producción.

5. Evaluación y calificación

Nombre Actividad de Aprendizaje / de Calificación (


Semana Temas
Evaluación % del 100%)
Evaluación Anticipatoria
1 Introducción a la asignatura Explorando y preparando sus datos con 5%
BigQuery
Laboratorio: Solucionar errores
5%
comunes de SQL con BigQuery
2 Unidad 1 Laboratorio: Explorar y crear una línea
5%
de análisis de comercio electrónico con
Cloud Dataprep
Laboratorio: Creación de nuevas tablas
3 5%
permanentes

Unidad 2 Laboratorio: Creación y gestión de


5%
tablas con particiones.
4
Laboratorio: Explorando un conjunto de
datos en Google Data Studio.

Laboratorio: Práctica con los APIs de


5 Unidad 3 5%
ML.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 76 de 109

DOCUMENTO CONTROLADO

Laboratorio: Creación de conjuntos de


6 datos de aprendizaje automático en 5%
BigQuery

Laboratorio: Construir modelos de


7 5%
clasificación en BigQuery
Entrega y Socialización del Trabajo Final 45%
Autoevaluación (Obligatoria en línea
Auto y coevaluación 3%
8 Asincrónica)

Refuerzo y Retroalimentación Evaluación del Curso. 2%

Total del Porcentaje 100%

6. Cronograma

Actividades
Seman Actividades
acompañamiento
a/Sesió Módulo y temas Independientes de
directo (Presencial o
n Aprendizaje: Asincrónico
sincrónica)
1. Módulo 1. Presentación del Presentación de los tema Exposición del docente y
Curso, contenidos usando las TIC ejercicios en tiempo real
programáticos, acuerdos Entrega del material de
generales, cronograma de trabajo para el semestre,
prueba diagnóstica.
actividades, aplicación de Lectura previa capítulo 1 de
prueba diagnóstica y Lakshmanan y lectura de
retroalimentación. capítulo 1 de Deshpande,
Introducción a los datos en Kumar y Chaudhari
la plataforma de la nube de
Google,
Tema 1. Fundamentos de
BigQuery
2. Tema 2. Lectura previa capítulo 3 de Exposición del docente y
Explorando sus datos con Lakshmanan y lectura de ejercicios en tiempo real
capítulo 8 de Tigani & Naidu
SQL, Limpieza y
transformación de datos
3. Módulo 2. Lectura previa capítulo 4 de Exposición del docente y
Tema 1. Almacenamiento y Lakshmanan y lectura de ejercicios en tiempo real
exportación de datos, capítulo 6 de Tigani & Naidu
creación de tablas
permanentes
4. Tema 2. Lectura previa capítulo 2,5 y 8 Exposición del docente y
Ingerir, unir y fusionar de Lakshmanan y lectura de ejercicios en tiempo real
nuevos conjuntos de datos en capítulo 7 y 9 de Tigani & Naidu
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 77 de 109

DOCUMENTO CONTROLADO

Google BigQuery, conjuntos


de datos, Explorando un
conjunto de datos en Google
Data Studio
Tema 3. Funciones
avanzadas de BigQuery SQL y
profundización en Data
Studio.
5. Módulo 3. Lectura previa capítulo 9 de Exposición del docente y
Tema 1. Introducción al Lakshmanan ejercicios en tiempo real
aprendizaje automático
Modelos de ML pre-
entrenados en la nube de
Google.
6. Tema 2. Creación de Lectura previa capítulo 9 de Exposición del docente y
conjuntos de datos ML en Lakshmanan ejercicios en tiempo real
BigQuery, Selección y pre
procesamiento de las
características
7. Tema 3. Creación de Lectura de capítulo 4 de Des- Exposición del docente y
conjuntos de datos de hpande, Kumar y Chaudhari ejercicios en tiempo real
aprendizaje automático en
BigQuery, Construyendo
modelos de clasificación en
BigQuery
8. Tutoría de proyecto de Presentación parcial del Socialización docente y
Investigación proyecto. estudiante

7. Bibliografía Básica y Complementaria

Lakshmanan, V., & Tigani, J. (2020). Google BigQuery The Definitive Guide. O'Reilly Media

Bibliografía Complementaria

Deshpande A., Kumar M., Chaudhari V. (2020). Hands-On Artificial Intelligence on Google Cloud Platform:
Build intelligent applications powered by TensorFlow, Cloud AutoML, BigQuery, and Dialogflow . Packt
Publishing.

Tigani, J., & Naidu, S. (2014). Google BigQuery Analytics. John Wiley & Sons.

Lopez, G., Seaton, D. T., Ang, A., Tingley, D., & Chuang, I. (2017, April). Google BigQuery for education:
Framework for parsing and analyzing edX MOOC data. In Proceedings of the fourth (2017) ACM
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 78 de 109

DOCUMENTO CONTROLADO

conference on learning@ scale (pp. 181-184).

Mucchetti, M. (2020). Advanced BigQuery. In BigQuery for Data Warehousing (pp. 273-303). Apress,
Berkeley, CA.

Fernandes, S., & Bernardino, J. (2015, July). What is bigquery?. In Proceedings of the 19th International
Database Engineering & Applications Symposium (pp. 202-203).

https://cloud.google.com/bigquery/docs/

https://cloud.google.com/billing/docs/how-to/visualize-data

https://cloud.google.com/bigquery-ml/docs

https://cloud.google.com/bi-engine/docs

https://www.coursera.org/learn/gcp-exploring-preparing-data-bigquery
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 79 de 109

DOCUMENTO CONTROLADO

Linea de profundización en
Bioestadística
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 80 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en estadística aplicada y ciencia de datos
Nombre de la Asignatura Epidemiología
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 10 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 8

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo Brda bordaricardo@unbosque.edu.co
Docente(s) J. David Ramos M. jedramos@unbosque.edu.co

Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación

Este espacio académico está orientado a profesionales que se desempeñan en las distintas ramas de las Ciencias
de la salud y corresponde a un curso de profundización en métodos estadísticos y de la Ciencia de datos aplicados
a la Epidemiología. Tiene dos propósitos fundamentales: primero, brindar a los estudiantes la oportunidad de
ahondar en los conceptos y métodos clásicos utilizados en el estudio de eventos de salud en poblaciones humanas
y segundo, presentar a los estudiantes un conjunto de técnicas recientes e innovadoras para el análisis de datos
epidemiológicos.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 81 de 109

DOCUMENTO CONTROLADO

La necesidad de un curso con las características descritas, obedece principalmente al aumento, casi exponencial,
de datos en salud (de las más variadas naturalezas) almacenados en grandes repositorios, que están a la espera
de ser analizados con el ánimo de generar nuevo conocimiento epidemiológico válido, verificable y útil. Desde
esta perspectiva, resulta fundamental la existencia de profesionales en salud competentes que sean capaces de
aplicar adecuadamente las distintas metodologías, clásicas y recientes, utilizadas para el análisis de esta nueva
generación de datos.

Con lo anterior en mente, el curso ofrece a los estudiantes la posibilidad de afianzar sus conocimientos en
Epidemiología, expandir su espectro profesional y de que, en un futuro próximo, puedan liderar o apoyar
proyectos de investigación en distintas áreas de la Salud Pública, la Bioestadística y la Epidemiología general y
clínica.

2. Contenidos Generales

Unidad 1. Introducción a la epidemiología


Unidad 2. Diseños de estudios epidemiológicos
Unidad 3. Estimación de medidas de riesgo y asociación
Unidad 4. Evaluación de asociación entre exposición y evento
Unidad 5. Inferencia causal: control confusión e interacción
Unidad 6. Modelos probabilísticos para riesgo en datos no pareados
Unidad 7. Modelos probabilísticos para riesgo en datos pareados
Unidad 8. Modelos probabilísticos para datos longitudinales

3. Objetivos de aprendizaje

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Conocimiento Profundizarán en los elementos conceptuales y metodológicos que fundamentan la
fundamental Epidemiología. Esto implica que serán capaces de: explicar los distintos diseños de los
estudios epidemiológicos; comprender los distintos métodos de inferencia de riesgos y
asociación entre factores poblacionales; explicar metodologías para el control de las
diferentes fuentes de sesgo, confusión y modificación de efectos en estudios
epidemiológicos y finalmente, comprender distintos modelos probabilísticos utilizados en
el estudio de la distribución de las enfermedades.

Aplicación Aplicarán adecuadamente métodos, tanto clásicos como recientes, propios de la


Bioestadística y la Ciencia de datos para la validación de hipótesis epidemiológicas
poblacionales que surgen en el estudio del desarrollo y distribución de las enfermedades
en presencia de múltiples de determinantes de la salud.
Integración Extenderán e integrarán los conocimientos y habilidades adquiridos a la solución de los
más variados problemas de las Ciencias de la salud, siendo capaces de diseñar, desarrollar
o asesorar proyectos de investigación en Epidemiología y/o otras ramas relacionadas.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 82 de 109

DOCUMENTO CONTROLADO

Dimensión Interactuarán con sus compañeros, a través del través del trabajo en equipo, mediante el
humana desarrollo de proyecto, talleres y otras actividades de aprendizaje. En este espacio, los
estudiantes podrán verse a sí mismos, evaluarse entre sí y apoyarse unos a otros. También
será capaces de solicitar respetuosamente apoyo académico a su docente y compañeros y
estarán en disposición de prestar la ayuda a sus compañeros.

Compromiso Mediante las aplicaciones vistas en clase los estudiantes estarán interesados en aprender
las temáticas desarrolladas en la asignatura; de esta forma los estudiantes adquirirán un
mayor compromiso personal para cumplir las metas de aprendizaje dentro de la asignatura
y las extenderán a su vida profesional.

Aprender a Estarán en disposición de apropiarse de su proceso de aprendizaje, indagando


aprender autónomamente en la literatura especializada sobre tendencias, enfoques y metodologías
epidemiológicas que van más allá de las temáticas expuestas dentro del curso. Esto implica
que, tendrán la capacidad de desarrollar planes de estudio propios que potencialicen sus
aprendizaje, utilizar adecuadamente fuentes de información útiles propias de las Ciencias
de la salud y formular nuevas inquietudes relacionadas con su quehacer profesional.
4. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:
Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.
La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de las ingenierías.
Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de
las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje –oral y escrito- y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN, la Maestría de Estadística aplicada y ciencias de datos
acoge las siguientes actividades para cumplir con lo referente al crédito educativo:
Tiempo en clase con el Docente (TCD)

Tiempo de taller en clase (TTC )

Tiempo de trabajo independiente. (TTI)

Lecturas previas a cada tema. (TTI).

Exposiciones del profesor (TCD).

Talleres en clase (TTC).

Resolución de problemas. (TCD, TTC, TTI).


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 83 de 109

DOCUMENTO CONTROLADO

Talleres individuales y grupales. (TTC, TTI).

Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).

Socialización presencial dirigida por el docente enfocado a la realimentación de las actividades de evaluación
(TCD, TTI).

Para el curso de Epidemiología las actividades anteriormente expuestas estarán consolidadas y orientadas a
través del notebook del curso, que no es más que un conjunto de notas de clase, lecturas de motivación e
introducción, ejercicios y prácticas con software estadístico recogidas y diseñadas por el profesor que orienta
la asignatura.

Paralelo al trabajo orientado por el notebook, también se realizarán prácticas apoyadas por software estadístico
en salas de informática, o en su defecto, en salones de clase convencionales donde cada estudiante trabajará
desde su propio equipo de cómputo, siempre bajo la orientación directa del docente encargado.

5. Evaluación y calificación

El proceso de evaluación tiene como propósito la formación integral del estudiante, sobre la base de una ética
que promueva la tolerancia, la solidaridad, la participación democrática, la creatividad y la equidad; tiene como
principio: ser continua, sistemática, interpretativa y formativa. Está acorde con el propósito de la misión
institucional de: “la promoción de la dignidad de la persona humana en su integralidad y el desarrollo de valores
éticos, morales, estéticos, históricos y tecno-científicos”. Este concepto se puede desglosar en tres partes
esenciales.

1. La evaluación es una actividad sistemática, continua: Es decir que se realiza a lo largo del proceso
de formación del alumno, que se basa en toda clase de datos, informes, pruebas, ejercicios, etc. y que se
sistematiza mediante una serie de sesiones o momentos evaluativos, que se suceden durante el curso. El
docente debe propiciar la evaluación formativa como elemento correctivo y facilitador de la autoevaluación por
parte del estudiante, logrando así los objetivos, los alcances propuestos por este y limitando su labor a ayudar,
corregir y orientar.

2. La evaluación está integrada en el proceso educativo. La evaluación no puede ser algo aparte,
secundario, realizado al final del proceso, debe formar parte de cada tema, de cada unidad, de cada actividad.
Debe encontrarse dentro del mismo proceso, dentro de la programación del trabajo en períodos cortos.

3. La evaluación se relaciona directamente con cada uno de los componentes curriculares. Para
reorientar las debilidades y acentuar las fortalezas determinando hasta qué punto se cumplen los objetivos. En
cuanto a la calificación del aprendizaje se tendrán en cuenta: Talleres resueltos en clase, en casa, parciales,
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 84 de 109

DOCUMENTO CONTROLADO

quices, investigación, exposiciones. Para cada tema se desarrollarán talleres, que podrán ser guiados desde la
tutoría o realizados dentro del proceso de la clase.

6. Cronograma

Actividades
Actividades
Semana/Sesió Independientes de
Módulo y temas acompañamiento directo
n Aprendizaje:
(Presencial o sincrónica)
Asincrónico
Semana 1 Unidad 1. Introducción Trabajo independiente de Presentación el curso. Exposición
Sesión 1 a la epidemiología los estudiantes con base en del docente relacionado con los
ejercicios propuestos en el objetivos y propósitos de la
notebook del curso. Epidemiología. Trabajo de los
estudiantes de ejercicios
propuestos en el notebook del
curso.
Semana 1 Unidad 2. Diseños de Trabajo independiente de Exposición del docente
Sesión 2 estudios epidemiológicos los estudiantes con base en relacionado con el diseño de
ejercicios propuestos en el estudios epidemiológicos.
notebook del curso. Trabajo de los estudiantes de
ejercicios propuestos en el
notebook del curso.
Semana 2 Unidad 3. Estimación Trabajo independiente de Exposición del docente
Sesión 1 de medidas de riesgo y los estudiantes con base en relacionado con el análisis de
asociación ejercicios propuestos en el tablas de contingencia y técnicas
notebook del curso. relacionadas con la estimación
del riesgo. Trabajo de los
estudiantes de ejercicios
propuestos en el notebook del
curso.
Semana 2 Unidad 4. Evaluación de Trabajo independiente de Exposición del docente
Sesión 2 asociación entre los estudiantes con base en relacionado con distintos test
exposición y evento ejercicios propuestos en el para evaluación de la
notebook del curso. independencia entre exposición-
evento. Trabajo de los
estudiantes de ejercicios
propuestos en el notebook del
curso.
Semana 3 Unidad 5. Inferencia Trabajo independiente de Exposición del docente
Sesión 1. causal: control confusión los estudiantes con base en relacionado con control de
e interacción variables confusoras y la
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 85 de 109

DOCUMENTO CONTROLADO

ejercicios propuestos en el interacción entre exposiciones.


notebook del curso. Trabajo de los estudiantes de
ejercicios propuestos en el
notebook del curso.
Semana 3 Unidad 6. Modelos Trabajo independiente de Exposición del docente
Sesión 2 probabilísticos para los estudiantes con base en relacionado con modelos
riesgo en datos no ejercicios propuestos en el probabilísticos para riesgo de
pareados notebook del curso. casos no pareados. Trabajo de
los estudiantes de ejercicios
propuestos en el notebook del
curso.
Semana 4 Unidad 7. Modelos Trabajo independiente de Exposición del docente
Sesión 1. probabilísticos para los estudiantes con base en relacionado con modelos
riesgo en datos pareados ejercicios propuestos en el probabilísticos para riesgo de
notebook del curso. casos pareados. Trabajo de los
estudiantes de ejercicios
propuestos en el notebook del
curso.
Semana 4 Unidad 8. Modelos Trabajo independiente de Exposición del docente
Sesión 2 probabilísticos para los estudiantes con base en relacionado con modelos
datos longitudinales. ejercicios propuestos en el probabilísticos para datos
notebook del curso. longitudinales. Trabajo de los
estudiantes de ejercicios
propuestos en el notebook del
curso.

7. Bibliografía Básica y Complementaria

Bibliografía Básica

1. Jewell, N. P. (2004). Statistics for epidemiology. Chapman and Hall/CRC. USA.

2. Woodward, M. (2013). Epidemiology: study design and data analysis. Chapman and Hall/CRC. 3a. edición.
USA.

3. Cleophas, T. J., Zwinderman, A. H., & Cleophas-Allers, H. I. (2013). Machine learning in medicine (Vol. 9) .
Dordrecht, The Netherlands:: Springer.

Bibliografía Complementaria

4. Kestenbaum, B., & Weiss, N. S. (2019). Epidemiology and biostatistics: an introduction to clinical research .
Springer Nature Switzerland AG. 2da. edición. Switzerland.

5. Agresti A., Kateri M. (2002) Categorical Data Analysis. John Wiley & Sons, Inc., Hoboken. USA, New
Jersey.

6. Kubat, M. (2017). An introduction to machine learning. Springer International Publishing AG.


Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 86 de 109

DOCUMENTO CONTROLADO

7. Williams, G. (2011). Data mining with Rattle and R: The art of excavating data for knowledge discovery .
Springer Science & Business Media.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 87 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en estadística aplicada y ciencia de datos
Nombre de la Asignatura Epidemiología espacial
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Obligatori
Tipo de Asignatura: X Electiva
a
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 10 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente/semana 8

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo Borda bordaricardo@unbosque.edu.co
Docente(s) J. David Ramos M. jdramos@unbosque.edu.co

Docente(s)
laboratorio
Asesor(es)

Estudiante –
Monitor Ad
Honorem

Información Académica

1. Justificación

El análisis espacial es un conjunto de técnicas estadísticas que utiliza como insumo la ubicación geográfica o
espacial de los eventos que se analizan. El uso de estas técnicas particulares de análisis en estudios de tipo
epidemiológico ha tenido un rápido crecimiento en las últimas décadas porque permiten incluir la variabilidad, la
correlación y la densidad espacial presente en la distribución espacial de casos y exposiciones de eventos en
salud.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 88 de 109

DOCUMENTO CONTROLADO

El curso aquí propuesto permite a los estudiantes conocer y profundizar en los métodos de análisis espacial
aplicados a la Epidemiología, desarrollando un abordaje descriptivo y analítico que hace énfasis en el uso,
ventajas y limitaciones de la visualización de datos de salud espaciales, los sistemas de información geográfica
y la inferencia y predicción sobre este tipo de datos.

Finalmente, el curso busca incentivar a los estudiantes que tomen el mismo, prosigan autónomamente en el
estudio del análisis espacial y que incorporen sus metodologías y técnicas particulares en su quehacer diario
profesional e investigativo.

2. Contenidos Generales

Unidad 1. Introducción al análisis de datos espaciales en salud


 Datos espaciales y sus componentes
 Sistemas de información geográfica (SIG)
 Visualización y modelamiento de datos espaciales
 Estudios epidemiológicos y datos espaciales
Unidad 2. Conceptos básicos de la estadística espacial
 Elementos básicos de estadística espacial
 Tipos de datos espaciales
 Correlación, estacionariedad y predicción espacial
Unidad 3. Análisis descriptivo de patrones puntuales en salud
 Análisis descriptivo de patrones puntuales en salud
 Análisis de la densidad de patrones puntuales
 Análisis de clústeres de eventos y exposiciones
Unidad 4. Análisis inferencial de patrones puntuales en salud
 Interpolación de patrones puntuales para eventos y exposiciones
 Modelamiento de patrones puntuales para predicción
Unidad 5. Análisis descriptivo de datos de áreas en salud
 Visualización de datos de áreas en salud
 Análisis exploratorio de datos de áreas en salud
 Análisis de estructuras de datos de áreas en salud
Unidad 6. Análisis inferencial de datos de áreas en salud
 Modelos de regresión espacial de datos de áreas en salud
 Técnicas de patrones puntuales aplicadas a áreas
Unidad 7. Análisis descriptivo de datos geoestadísticos en salud
 Visualización de datos geoestadísticos en salud
 Análisis de variables regionalizadas en salud
Unidad 8. Análisis inferencial de datos geoestadísticos en salud
 Kriging para predicción de eventos de salud

3. Objetivos de aprendizaje
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 89 de 109

DOCUMENTO CONTROLADO

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Conocimiento Profundizarán en conceptos y procedimientos que fundamentan la estadística espacial,
fundamental los tipos de datos espaciales, los sistemas de información geográfica, la visualización,
descripción y predicción de datos espaciales y finalmente, su aplicación a estudios
relacionados con las Ciencias de la Salud, en particular, con la Epidemiología.

Aplicación Aplicarán adecuadamente métodos y técnicas, tanto clásicos como recientes, propios de
la estadística espacial para el análisis de la distribución espacial de eventos en salud de
poblaciones humanas y utilizarán el conocimiento que se decante de dicho análisis para
la solución de problemas propios de su área de estudio y/o su quehacer profesional.
Integración Extenderán e integrarán los conocimientos y habilidades adquiridos a la solución de los
más variados problemas en Epidemiología y otras áreas de las Ciencias de la Salud,
siendo capaces de diseñar, desarrollar o asesorar proyectos de investigación donde
exista la necesidad de analizar datos de salud espacialmente distribuidos.
Dimensión humana Interactuarán con sus compañeros, a través del través del trabajo en equipo, mediante
el desarrollo de proyecto, talleres y otras actividades de aprendizaje. En este espacio,
los estudiantes podrán verse a sí mismos, evaluarse entre sí y apoyarse unos a otros.
También será capaces de solicitar respetuosamente apoyo académico a su docente y
compañeros y estarán en disposición de prestar la ayuda a sus compañeros.

Compromiso Estarán interesados en aprender las temáticas desarrolladas en la asignatura y tendrán


la motivación de profundizar e ir más allá de lo expuesto en las clases; de esta forma
los estudiantes adquirirán un mayor compromiso personal para cumplir las metas de
aprendizaje dentro de la asignatura y las extenderán a su vida profesional.

Aprender a Estarán en disposición de apropiarse de su proceso de aprendizaje, indagando


aprender autónomamente en la literatura especializada sobre tendencias, enfoques y
metodologías del análisis epidemiológico espacial que van más allá de las temáticas
expuestas dentro del curso. Esto implica que, tendrán la capacidad de desarrollar planes
de estudio propios que potencialicen sus aprendizaje, utilizar adecuadamente fuentes
de información útiles propias de las Ciencias de la salud y formular nuevas inquietudes
relacionadas con su quehacer profesional.
4. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:
Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.
La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de las ingenierías.
Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de
las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 90 de 109

DOCUMENTO CONTROLADO

a través del lenguaje –oral y escrito- y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN, la Maestría de Estadística aplicada y ciencias de datos
acoge las siguientes actividades para cumplir con lo referente al crédito educativo:
Tiempo en clase con el Docente (TCD)

Tiempo de taller en clase (TTC )

Tiempo de trabajo independiente. (TTI)

Lecturas previas a cada tema. (TTI).

Exposiciones del profesor (TCD).

Talleres en clase (TTC).

Resolución de problemas. (TCD, TTC, TTI).

Talleres individuales y grupales. (TTC, TTI).

Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).

Socialización presencial dirigida por el docente enfocado a la realimentación de las actividades de evaluación
(TCD, TTI).

Para el curso de Epidemiología espacial las actividades anteriormente expuestas estarán consolidadas y
orientadas a través del notebook del curso, que no es más que un conjunto de notas de clase, lecturas de
motivación e introducción, ejercicios y prácticas con software estadístico recogidas y diseñadas por el profesor
que orienta la asignatura.

Paralelo al trabajo orientado por el notebook, también se realizarán prácticas apoyadas por software estadístico
en salas de informática, o en su defecto, en salones de clase convencionales donde cada estudiante trabajará
desde su propio equipo de cómputo, siempre bajo la orientación directa del docente encargado.

5. Evaluación y calificación

El proceso de evaluación tiene como propósito la formación integral del estudiante, sobre la base de una ética
que promueva la tolerancia, la solidaridad, la participación democrática, la creatividad y la equidad; tiene como
principio: ser continua, sistemática, interpretativa y formativa. Está acorde con el propósito de la misión
institucional de: “la promoción de la dignidad de la persona humana en su integralidad y el desarrollo de valores
éticos, morales, estéticos, históricos y tecno-científicos”. Este concepto se puede desglosar en tres partes
esenciales.

1. La evaluación es una actividad sistemática, continua: Es decir que se realiza a lo largo del proceso
de formación del alumno, que se basa en toda clase de datos, informes, pruebas, ejercicios, etc. y que se
sistematiza mediante una serie de sesiones o momentos evaluativos, que se suceden durante el curso. El
docente debe propiciar la evaluación formativa como elemento correctivo y facilitador de la autoevaluación por
parte del estudiante, logrando así los objetivos, los alcances propuestos por este y limitando su labor a ayudar,
corregir y orientar.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 91 de 109

DOCUMENTO CONTROLADO

2. La evaluación está integrada en el proceso educativo. La evaluación no puede ser algo aparte,
secundario, realizado al final del proceso, debe formar parte de cada tema, de cada unidad, de cada actividad.
Debe encontrarse dentro del mismo proceso, dentro de la programación del trabajo en períodos cortos.

3. La evaluación se relaciona directamente con cada uno de los componentes curriculares. Para
reorientar las debilidades y acentuar las fortalezas determinando hasta qué punto se cumplen los objetivos. En
cuanto a la calificación del aprendizaje se tendrán en cuenta: Talleres resueltos en clase, en casa, parciales,
quices, investigación, exposiciones. Para cada tema se desarrollarán talleres, que podrán ser guiados desde la
tutoría o realizados dentro del proceso de la clase.

6. Cronograma

Actividades Actividades
Semana/Sesión Módulo y temas Independientes de acompañamiento directo
Aprendizaje: Asincrónico (Presencial o sincrónica)
Semana 1 Unidad 1. Trabajo independiente de los Presentación el curso.
Sesión 1 Introducción al estudiantes con base en Exposición del docente
análisis de datos ejercicios propuestos en el relacionado con los objetivos y
espaciales en salud notebook del curso. propósitos del análisis de datos
 Datos espaciales y sus espaciales en salud y
componentes Epidemiología. Trabajo de los
 Sistemas de estudiantes de ejercicios
información propuestos en el notebook del
geográfica (SIG) curso.
 Visualización y
modelamiento de
datos espaciales
 Estudios
epidemiológicos y
datos espaciales

Semana 1 Unidad 2. Conceptos Trabajo independiente de los Exposición del docente


Sesión 2 básicos de la estudiantes con base en relacionado con los
estadística espacial ejercicios propuestos en el fundamentos de Estadística
 Elementos básicos de notebook del curso. espacial, sus ramas y las
estadística espacial particularidades de los datos
 Tipos de datos espacialmente distribuidos.
espaciales Trabajo de los estudiantes de
 Correlación, ejercicios propuestos en el
estacionariedad y notebook del curso.
predicción espacial
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 92 de 109

DOCUMENTO CONTROLADO

Semana 2 Unidad 3. Análisis Trabajo independiente de los Exposición del docente


Sesión 1 descriptivo de estudiantes con base en relacionado con el análisis
patrones puntuales ejercicios propuestos en el descriptivo de eventos de salud
en salud notebook del curso. como patrones puntuales.
 Análisis descriptivo de Trabajo de los estudiantes de
patrones puntuales en ejercicios propuestos en el
salud notebook del curso.
 Análisis de la densidad
de patrones puntuales
 Análisis de clústeres de
eventos y exposiciones

Semana 2 Unidad 4. Análisis Trabajo independiente de los Exposición del docente


Sesión 2 inferencial de estudiantes con base en relacionado con el
patrones puntuales ejercicios propuestos en el modelamiento para inferencia
en salud notebook del curso. y predicción de eventos de
 Interpolación de salud como patrones
patrones puntuales puntuales. Trabajo de los
para eventos y estudiantes de ejercicios
exposiciones propuestos en el notebook del
 Modelamiento de curso.
patrones puntuales
para predicción

Semana 3 Unidad 5. Análisis Trabajo independiente de los Exposición del docente


Sesión 1. descriptivo de datos estudiantes con base en relacionado con el análisis
de áreas en salud ejercicios propuestos en el descriptivo de datos de áreas
 Visualización de datos notebook del curso. en salud y Epidemiología.
de áreas en salud Trabajo de los estudiantes de
 Análisis exploratorio ejercicios propuestos en el
de datos de áreas en notebook del curso.
salud
 Análisis de estructuras
de datos de áreas en
salud

Semana 3 Unidad 6. Análisis Trabajo independiente de los Exposición del docente


Sesión 2 inferencial de datos estudiantes con base en relacionado con el
de áreas en salud ejercicios propuestos en el modelamiento para inferencia
 Modelos de regresión notebook del curso. y predicción de eventos de
espacial de datos de salud como datos de áreas.
áreas en salud Trabajo de los estudiantes de
 Técnicas de patrones ejercicios propuestos en el
puntuales aplicadas a notebook del curso.
áreas
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 93 de 109

DOCUMENTO CONTROLADO

Semana 4 Unidad 7. Análisis Trabajo independiente de los Exposición del docente


Sesión 1. descriptivo de datos estudiantes con base en relacionado el análisis
geoestadísticos en ejercicios propuestos en el descriptivo de datos
salud notebook del curso. geoestadísticos de salud.
 Visualización de datos Trabajo de los estudiantes de
geoestadísticos en ejercicios propuestos en el
salud notebook del curso.
 Análisis de variables
regionalizadas en
salud

Semana 4 Unidad 8. Análisis Trabajo independiente de los Exposición del docente


Sesión 2 inferencial de datos estudiantes con base en relacionado el modelamiento
geoestadísticos en ejercicios propuestos en el para predicción de datos
salud notebook del curso. geoestadísticos en salud.
 Kriging para predicción Trabajo de los estudiantes de
de eventos de salud ejercicios propuestos en el
notebook del curso.

7. Bibliografía Básica y Complementaria

Bibliografía Básica

1. Waller, L. A., & Gotway, C. A. (2004). Applied spatial statistics for public health data (Vol. 368). John Wiley
& Sons.

2. Andrade, A. L., et al. (2007). Introdução à estatística espacial para a saúde pública. Brasil: Ministério da
Saúde. Secretaria de Vigilância em Saúde. Fundação Oswaldo Cruz.

3. Giraldo Henao, R. (2011). Estadística espacial, notas de clase. Bogotá: Universidad Nacional de Colombia.

Bibliografía Complementaria

4. Thomas, D. C. (2009). Statistical methods in environmental epidemiology. Oxford University Press, USA.

5. Bivand, R. S., Pebesma, E. J., Gómez-Rubio, V., & Pebesma, E. J. (2008). Applied spatial data analysis
with R (Vol. 747248717, pp. 237-268). New York: Springer.

6. Peng, R. D., & Dominici, F. (2008). Statistical methods for environmental epidemiology with R. R: a case
study in air pollution and health. New York: Springer.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 94 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en Estadística aplicada y Ciencia de datos
Nombre de la Asignatura Análisis de Supervivencia
Semestr
Código de la Asignatura Periodo Académico
e
Área Curricular
Tipo de Asignatura: Obligatoria Electiva
Modalidad %: Teórica Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 3 10 sincrónicas /periodo 40
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico 80

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día –
Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Jesús  jdramos@unbosque.edu.co
David  erodriguezar@unbosque.edu.co
Ramos
Emiliano
Rodríguez
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

57. Justificación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 95 de 109

DOCUMENTO CONTROLADO

Este curso está orientado a profesionales de las distintas ramas de las Ciencias de la salud y corresponde a un
curso de profundización en análisis de supervivencia, aplicados a la Biología y Medicina. Esta asignatura empleará
técnicas clásicas de estadística no paramétricas con metodologías enfocadas en el estudio de individuos y el
procesamiento de grandes volúmenes de información.

El análisis de supervivencia es una técnica inferencial que tiene como objetivo esencial modelizar el tiempo tarda
en ocurrir un determinado suceso, es mediante el análisis e interpretación de datos en el campo de la
investigación médica y de la biología que se pretende generar soluciones a problemas reales y ayudar en el
proceso de toma de decisiones acertadas. Desde esta perspectiva, resulta fundamental que los profesionales en
salud creen ventajas comparativas, generando profesionales competentes que sean capaces de aplicar
adecuadamente las distintas metodologías, clásicas y recientes, en especial, en la era digital en la que estamos
inmersos, con grandes volúmenes de datos para ser estudiados.

58. Contenidos Generales

Unidad 1: Introducción al análisis de supervivencia y Principios Básicos del Análisis de


supervivencia.
Unidad 2: Estimación No paramétrica de la curva de supervivencia.
Unidad 3: Análisis de Regresión para estimación de riesgo.
Unidad 4: Deep-Hit Model. Aprendizaje profundo para el análisis de supervivencia.

59. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Profundizarán en los elementos conceptuales y metodológicos que fundamentan la
Biología y la Medicina. Los estudiantes estarán en capacidad de identificar y explicar
Conocimiento los distintos diseños y técnicas estadísticas empleadas en los estudios médicos y
fundamental biológicos; y comprender distintos métodos de inferencia aplicados al estudio de las
ciencias de la salud.

Aplicarán adecuadamente métodos de la Bioestadística y técnicas innovadoras en el


análisis y procesamiento de la información para la validación y comparación de curvas
de supervivencia, entre otros.
Aplicación
Integrarán los conocimientos y habilidades adquiridos en el curso a la solución de
problemas en las Ciencias de la salud, con el fin de hacer inferencias de variables y
Integración orientar procesos de integración de saberes en todas las esferas del conocimiento.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 96 de 109

DOCUMENTO CONTROLADO

El curso permite que los estudiantes interactúen con sus compañeros y docentes, a
través de los distintos escenarios de aprendizaje como talleres, proyectos en grupo y
Dimensión humana demás, esta interacción se da gracias al trato tolerante y respetuoso entre las partes.
Los estudiantes podrán verse a sí mismos como profesionales y seres humanos
capaces de lograr metas y generar soluciones eficientes a las distintas problemáticas
de su área de estudio.

El curso ofrece las bases teóricas y prácticas de los métodos estadísticos. Los
Compromiso estudiantes valorarán el conocimiento adquirido en el curso, de tal forma que puede
realizar futuras investigaciones autónomas aplicando las herramientas vistas y
aportando estudios innovadores en su campo de acción.

Estarán en capacidad de generar planes de estudio conforme al proceso de aprendizaje


adquirido tanto académica como autónomamente, utilizando adecuadamente fuentes
Aprender a aprender de información y generando nuevas inquietudes en su ámbito profesional.

60. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:

Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.

La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de las ingenierías.

Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de


las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje –oral y escrito- y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN. El departamento de matemáticas acoge las siguientes
actividades para cumplir con lo referente al crédito educativo:
Tiempo en clase con el Docente (TCD)
Tiempo de taller en clase (TTC )
Tiempo de trabajo independiente. (TTI)
Lecturas previas a cada tema. (TTI).
Exposiciones del profesor (TCD).
Talleres en clase (TTC).
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 97 de 109

DOCUMENTO CONTROLADO

Resolución de problemas. (TCD, TTC, TTI)


Talleres individuales y grupales. (TTC, TTI).
Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).
Socialización presencial dirigida por el docente, enfocada a la realimentación de las actividades de evaluación
(TCD, TTI).

61. Evaluación y calificación

El proceso de evaluación tiene como propósito la formación integral del estudiante, sobre la base de una ética
que promueva la tolerancia, la solidaridad, la participación democrática, la creatividad y la equidad; tiene como
principio: ser continua, sistemática, interpretativa y formativa. Está acorde con el propósito de la misión
institucional de: “la promoción de la dignidad de la persona humana en su integralidad y el desarrollo de valores
éticos, morales, estéticos, históricos y tecno-científicos”. Este concepto se puede desglosar en tres partes
esenciales.

1. La evaluación es una actividad sistemática, continua: Es decir que se realiza a lo largo del proceso
de formación del alumno, que se basa en toda clase de datos, informes, pruebas, ejercicios, etc. y que se
sistematiza mediante una serie de sesiones o momentos evaluativos, que se suceden durante el curso. El
docente debe propiciar la evaluación formativa como elemento correctivo y facilitador de la autoevaluación por
parte del estudiante, logrando así los objetivos, los alcances propuestos por este y limitando su labor a ayudar,
corregir y orientar.

2. La evaluación está integrada en el proceso educativo. La evaluación no puede ser algo aparte,
secundario, realizado al final del proceso, debe formar parte de cada tema, de cada unidad, de cada actividad.
Debe encontrarse dentro del mismo proceso, dentro de la programación del trabajo en períodos cortos.

3. La evaluación se relaciona directamente con cada uno de los componentes curriculares. Para
reorientar las debilidades y acentuar las fortalezas determinando hasta qué punto se cumplen los objetivos. En
cuanto a la calificación del aprendizaje se tendrán en cuenta: Talleres resueltos en clase, en casa, parciales,
quices, investigación, exposiciones. Para cada tema se desarrollarán talleres, que podrán ser guiados desde la
tutoría o realizados dentro del proceso de la clase.

62. Cronograma

Actividades
Actividades
Semana/Sesió Independientes de
Módulo y temas acompañamiento directo
n Aprendizaje:
(Presencial o sincrónica)
Asincrónico
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 98 de 109

DOCUMENTO CONTROLADO

Semana 1  ¿Qué es el Los estudiantes trabajarán A través de los notebooks


Sesión 1 análisis de aplicando la técnica en un preparados con un caso de uso
Introducción supervivencia? conjunto de datos elegidos de epidemiologia se llevarán a
al análisis de por ellos mismos. cabo las clases con el fin de
 Algunas
supervivencia. explicar los conceptos de forma
aplicaciones. aplicada
 Introducción a la
Estadística No
paramétrica.

Semana 1  El Después de las clases Se darán clases presenciales


Sesión 2 riesgo(hazard) magistrales los estudiantes para después trabajar
Principios y Funciones de trabajarán conjuntamente con los
Básicos del supervivencia. independientemente en los estudiantes en la aplicación de
Análisis de Tiempo de conceptos aprendidos a los conceptos aprendidos.
supervivencia supervivencia clase.
medio y
mediano.
 Distribuciones
paramétricas de
supervivencia.
 La función de
supervivencia, a
partir de la
función de
Riesgo (
Hazard).

Semana 2  Estimación no Se realizarán clases magistrales


Sesión 1 paramétrica de Los estudiantes aplicarán con los conceptos y fundamentos
Estimación No la función de los conceptos aprendidos teóricos para posteriormente
paramétrica supervivencia. en clase para realizar los realizar la aplicación del código
de la curva de  Encontrar la ejercicios dejados como en datos de bioestadística.
supervivencia. mediana de la trabajo autónomo.
función de
supervivencia.

Semana 2  Intervalo de El estudiante aplicará los Con el acompañamiento del


Sesión 2 confianza para conceptos aprendidos en la profesor los estudiantes
Estimación No la mediana. resolución de casos de uso trabajarán en la aplicación y
paramétrica de bioestadística. entendimiento del código de
 Estimación
de la curva de notebook de Jupyter.
suavizada de la
supervivencia.
función de
supervivencia y
Riesgo(Hazard).
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 99 de 109

DOCUMENTO CONTROLADO

 Comparación de
dos grupos de
tiempos de
supervivencia.
Semana 3  Covariables y Los estudiantes reforzarán El profesor dará los conceptos y
Sesión 1. modelos de los conceptos aprendidos en fundamentos teóricos junto con
Análisis de supervivencia no clase a través de ejercicios el acompañamiento en la
Regresión paramétricos. en los que aplicarán el aplicación de los conceptos en
para código en datos datos reales.
estimación de relacionados en
riesgo bioestadística.

Semana 3  Test Wald y Test Después de la clase el Se brindarán los fundamentos


Sesión 2 de Score. estudiante aplicará el código teóricos junto con las
Análisis de  Selección del visto en los notebooks de herramientas y el código
Regresión modelo e Jupyter en la resolución de necesario para la aplicación,
para interpretación. casos de uso.
estimación de
 Diagnóstico del
riesgo
Modelo.

Semana 4  DeepSurv. Los estudiantes aplicarán Se explicará lo que es DeepSurv


Sesión 1.  DeepHit. los conceptos aprendidos en y DeepHit,y se hará una
DeepHit clase a través de la implementación práctica para
Model. aplicación del código en entender mejor y estos
Aprendizaje Jupyter conceptos.
profundo para el
análisis de
supervivencia.

Semana 4  Indice de Los estudiantes reforzarán El profesor explicará formas de


Sesión 2 Concordancia. los conceptos aprendidos en evaluar los modelos de
DeepHit  Curvas de clase a través de la supervivencia, se explicará la
Model. supervivencia. aplicación de los conceptos medida de evaluación más
Aprendizaje  Gráficos de aprendidos en datos reales. común, la cual es el índice c.
profundo para el Peligro.
análisis de
supervivencia.

63. Bibliografía Básica y Complementaria.

13. David W. Hosmer Jr. , Stanley Lemeshow , Susanne May . (2008). Applied Survival Analysis:
Regression Modeling of Time-to-Event Data, 2nd Edition. Wiley 10.1002/9780470258019.ch2. ISBN:
978-0-471-75499-2.
14. Moore, Dirk F. (2016). Applied Survival Analysis Using R. Springer
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 100 de 109

DOCUMENTO CONTROLADO

15. Rizopoulos, Dimitris. (2012). Joint Models for Longitudinal and Time-to-Event Data: With
Applications in R. Chapman & Hall/CRC Biostatistics Series. Book Depository. ISBN: 10 1439872864
16. Klein, John P., Moeschberger , Melvin L. (2003). Survival Analysis. Techniques for Censored and
Truncated Data. Springer 10.1007/b97377.
17. Kleinbaum, David G., Klein, Mitchel. (2012). Survival Analysis. A Self-Learning Text, Third Edition.
Springer 10.1007/978-1-4419-6646-9.
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 101 de 109

DOCUMENTO CONTROLADO

Área de investigación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 102 de 109

DOCUMENTO CONTROLADO
Instructivo de diligenciamiento (No imprimir, ni diligenciar desde la página 1 a la 3)

Facultad Facultad de Ciencias


Programa Maestría en Estadística aplicada y Ciencia de datos
Nombre de la Asignatura SEMINARIO DE INVESTIGACIÓN
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica X Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 6 10 sincrónicas /periodo 80
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

64. Justificación

En esta asignatura los estudiantes realzarán la primera fase de su trabajo de grado. La finalidad del curso es
permitir que los estudiantes desarrollen una idea de investigación, la consoliden y expongan su propuesta de
investigación
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 103 de 109

DOCUMENTO CONTROLADO

65. Contenidos Generales

1. Investigación cuantitativa
2. Investigación cualitativa

66. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes de la maestría estarán en capacidad de identificar y comprender la
primera fase de su trabajo de grado.
Conocimiento
fundamental
Los estudiantes Gestionarán todo lo relacionado con la parte administrativa de la
asignatura. Crearán herramientas que le permitan desarrollar el trabajo de grado.
Analizarán las posibles opciones que se presentan para la realización de su trabajo de
grado.
Aplicación
Los estudiantes podrán aplicar los conocimientos vistos otra asignaturas y aplicarlos
en su trabajo de grado
Integración
Mediante el trabajo en equipo y el trabajo en equipo los estudiantes de la maestría
podrán interactuar con profesionales de otras disciplinas.
Dimensión humana

Se comprometerán como profesionales y persona con los compromisos adquiridos en


Compromiso el trabajo de grado
Finalizarán su primera fase trabajo de grado

Aprender a aprender

67. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 104 de 109

DOCUMENTO CONTROLADO

Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.

La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de la Estadística.

Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de


las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje (oral y escrito) y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN. El departamento de matemáticas acoge las siguientes
actividades para cumplir con lo referente al crédito educativo:

Tiempo en clase con el Docente (TCD)

Tiempo de taller en clase (TTC )

Tiempo de trabajo independiente. (TTI)


Lecturas previas a cada tema. (TTI).
Exposiciones del profesor (TCD).
Talleres en clase (TTC).
Resolución de problemas. (TCD, TTC, TTI)
Talleres individuales y grupales. (TTC, TTI).
Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).

68. Evaluación y calificación

 100% en una única sustentación oral y revisión del documento escrito del trabajo de grado.

69. Cronograma
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 105 de 109

DOCUMENTO CONTROLADO

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Presentación por parte del Instalación de R, Rstudio, Presentación por parte del
docente de las reglas a seguir instalación de paquetes y sus docente de las reglas a seguir
durante la asignatura dependencias. durante la asignatura
2. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
3. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
4. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
5. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
6. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
7. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
8. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes

70. Bibliografía Básica y Complementaria

- Erazo-Jiménez, M. S. (2011). Rigor científico en las prácticas de investigación cualitativa. Ciencia,


Docencia y Tecnología, 22(42), 107-136.
- Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2010). Metodología de la
investigación (5a. ed.). México; Bogotá; Buenos Aires: McGraw-Hill.
- Tamayo y Tamayo Mario. (1977). Metodología formal de la investigación científica (1a. ed.). Cali:
Limusa. Sautu, R., Freidin, B., Perugorria, I., Borriolo, P., Brom, L., Dalle, P., ... & Pia Otero, M. (2007).
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 106 de 109

DOCUMENTO CONTROLADO

Facultad Facultad de Ciencias


Programa Maestría en Estadística aplicada y Ciencia de datos
Nombre de la Asignatura Proyecto de tesis
Cuatrim
Código de la Asignatura 3 Periodo Académico
estre
Área Curricular
Tipo de Asignatura: Obligatoria X Electiva
Modalidad %: Teórica X Práctica Teórica- práctica
Pre-requisitos (Código y
nombre):
Co-requisitos (Código y
Nombre):
Horas presenciales o
Horas presenciales o
Número de créditos: 12 10 sincrónicas /periodo 160
sincrónicas /semana
académico
Horas Trabajo Independiente /periodo académico

EQUIPO DOCENTE

Horario Espacio de
Nombre Correo Electrónico atención a atención a
Estudiantes estudiantes
(Día – Hora)
Coordinador(es) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s) Ricardo bordaricardo@unbosque.edu.co
Borda
Docente(s)
laboratorio
Asesor(es)
Estudiante –
Monitor Ad
Honorem

Información Académica

71. Justificación

En esta asignatura los estudiantes desarrollaran y finalizan su trabajo de grado. La finalidad del curso es permitir
que los estudiantes desarrollen su idea de investigación y la expongan al final
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 107 de 109

DOCUMENTO CONTROLADO

72. Contenidos Generales

Desarrollo de la investigación

73. Objetivos de aprendizaje:

Dimensión de
Objetivos de aprendizaje
aprendizaje
Los estudiantes aprenderán o estarán en capacidad:
significativo
Los estudiantes de la maestría estarán en capacidad de identificar y comprender la
primera su trabajo de grado.
Conocimiento
fundamental
Los estudiantes Gestionarán todo lo relacionado con la parte administrativa de la
asignatura. Crearán herramientas que le permitan desarrollar el trabajo de grado.
Analizarán las posibles opciones que se presentan para la realización de su trabajo de
grado.
Aplicación
Los estudiantes podrán aplicar los conocimientos vistos otra asignaturas y aplicarlos
en su trabajo de grado
Integración
Mediante el trabajo en equipo y el trabajo en equipo los estudiantes de la maestría
podrán interactuar con profesionales de otras disciplinas.
Dimensión humana

Se comprometerán como profesionales y persona con los compromisos adquiridos en


Compromiso el trabajo de grado
Finalizarán su primera fase trabajo de grado

Aprender a aprender

74. Actividades generales de aprendizaje

METODOLOGÍA
La metodología propuesta para todos los cursos se basa en tres principios generales y fundamentales:

Una metodología cooperativa, donde tanto el profesor como el estudiante aportan para la conformación
del cuerpo conceptual del área. El estudiante aporta a través de la lectura de los materiales presentados, la
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 108 de 109

DOCUMENTO CONTROLADO

elaboración de ejercicios y otras actividades propias de su rol y el profesor aporta en la profundización y relación
de los conceptos. A la vez la metodología se nutrirá de los aportes del software utilizado.

La resolución de problemas y orientación de aplicaciones, como una de las tendencias en educación que
buscan un efecto positivo en la relación matemáticas y otros campos del saber. Para el caso particular el campo
propio de la Estadística.

Procesos de argumentación y de representación. Se logra la comprensión por parte del estudiante de


las formas que utiliza para aproximarse a los conocimientos y la forma como da cuenta de estas aproximaciones
a través del lenguaje (oral y escrito) y de las formas de representación que utiliza en la solución de problemas.
Según Decreto 808 del 25 de abril del 2002 del MEN. El departamento de matemáticas acoge las siguientes
actividades para cumplir con lo referente al crédito educativo:

Tiempo en clase con el Docente (TCD)

Tiempo de taller en clase (TTC )

Tiempo de trabajo independiente. (TTI)

Lecturas previas a cada tema. (TTI).


Exposiciones del profesor (TCD).
Talleres en clase (TTC).
Resolución de problemas. (TCD, TTC, TTI)
Talleres individuales y grupales. (TTC, TTI).
Programas de computación aplicados a los temas tratados. (TCD, TTC, TTI).

75. Evaluación y calificación

 100% en una única sustentación oral y revisión del documento escrito del trabajo de grado.

76. Cronograma
Código: F-GP-06-01
GESTIÓN DE LOS PROGRAMAS
Versión: 1, 30-07-2020

Formato Institucional de Asignaturas Página 109 de 109

DOCUMENTO CONTROLADO

Seman Actividades Actividades


a/Sesió Módulo y temas Independientes de acompañamiento directo
n Aprendizaje: Asincrónico (Presencial o sincrónica)
1. Presentación por parte del Instalación de R, Rstudio, Presentación por parte del
docente de las reglas a seguir instalación de paquetes y sus docente de las reglas a seguir
durante la asignatura dependencias. durante la asignatura
2. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
3. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
4. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
5. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
6. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
7. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes
8. Exposición por parte de los Lectura previa Exposición por parte de los
estudiantes estudiantes

77. Bibliografía Básica y Complementaria

- Erazo-Jiménez, M. S. (2011). Rigor científico en las prácticas de investigación cualitativa. Ciencia,


Docencia y Tecnología, 22(42), 107-136.
- Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2010). Metodología de la
investigación (5a. ed.). México; Bogotá; Buenos Aires: McGraw-Hill.
- Tamayo y Tamayo Mario. (1977). Metodología formal de la investigación científica (1a. ed.). Cali:
Limusa. Sautu, R., Freidin, B., Perugorria, I., Borriolo, P., Brom, L., Dalle, P., ... & Pia Otero, M. (2007).

También podría gustarte