Está en la página 1de 62

Silabo

Machine learning
La plataforma R

DATA ANALYTICS CON R

UNIDAD 1. INTRODUCCIÓN

Author: Dr. Manuel Castillo-Cara

Escuela de posgrado
Universidad Peruana Cayetano Heredia

May 9, 2019

Dr. Manuel Castillo-Cara Data Analytics con R 1/19


Silabo
Machine learning
La plataforma R

Contenidos

1 Silabo
Datos generales
Sumilla

2 Machine learning
Definición
Nuestro curso
Temario

3 La plataforma R
Por qué utilizar R
Qué es R
Consejos

Dr. Manuel Castillo-Cara Data Analytics con R 2/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Datos generales

Nombre: Data Analytics con R.

Modalidad: Virtual.

Dr. Manuel Castillo-Cara Data Analytics con R 3/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Datos generales

Nombre: Data Analytics con R.

Modalidad: Virtual.

Profesor – Dr. Manuel Castillo-Cara

Profesor de la Universidad Nacional de Ingenierı́a


(UNI) en la escuela de Ciencia de la Computación y
Jefe del laboratorio IUT–SCi.
Doctorado en Ingenierı́a Informática en la
Universidad de Castilla-La Mancha (España).

Dr. Manuel Castillo-Cara Data Analytics con R 3/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Datos generales

Nombre: Data Analytics con R.

Modalidad: Virtual.

Profesor – Dr. Manuel Castillo-Cara

Profesor de la Universidad Nacional de Ingenierı́a


(UNI) en la escuela de Ciencia de la Computación y
Jefe del laboratorio IUT–SCi.
Doctorado en Ingenierı́a Informática en la
Universidad de Castilla-La Mancha (España).

Requisitos del curso


Conocimientos intermedios de programación en R. Se recomienda haber
llevado el curso “Programación estadı́stica con R”.

Dr. Manuel Castillo-Cara Data Analytics con R 3/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Datos generales

Nombre: Data Analytics con R.

Modalidad: Virtual.

Profesor – Dr. Manuel Castillo-Cara

Profesor de la Universidad Nacional de Ingenierı́a


(UNI) en la escuela de Ciencia de la Computación y
Jefe del laboratorio IUT–SCi.
Doctorado en Ingenierı́a Informática en la
Universidad de Castilla-La Mancha (España).

Requisitos del curso


Conocimientos intermedios de programación en R. Se recomienda haber
llevado el curso “Programación estadı́stica con R”.
Conocimientos básicos de machine learning. Se remienda haber llevado
el curso “Machine learning para la investigación”.
Dr. Manuel Castillo-Cara Data Analytics con R 3/19
Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Datos generales

Nombre: Data Analytics con R.

Modalidad: Virtual.

Profesor – Dr. Manuel Castillo-Cara

Profesor de la Universidad Nacional de Ingenierı́a


(UNI) en la escuela de Ciencia de la Computación y
Jefe del laboratorio IUT–SCi.
Doctorado en Ingenierı́a Informática en la
Universidad de Castilla-La Mancha (España).

Requisitos del curso


Conocimientos intermedios de programación en R. Se recomienda haber
llevado el curso “Programación estadı́stica con R”.
Conocimientos básicos de machine learning. Se remienda haber llevado
el curso “Machine learning para la investigación”.
Dr. Manuel Castillo-Cara Data Analytics con R 3/19
Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Definición

En este curso se trabajará la analı́tica de datos para poder trabajar


correctamente machine learning con R.

Se trabajará el proceso paso a paso que puede utilizar para comenzar y


ser bueno en el machine learning para el modelado predictivo en la
plataforma R.

Dr. Manuel Castillo-Cara Data Analytics con R 4/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Definición

En este curso se trabajará la analı́tica de datos para poder trabajar


correctamente machine learning con R.

Se trabajará el proceso paso a paso que puede utilizar para comenzar y


ser bueno en el machine learning para el modelado predictivo en la
plataforma R.

Dr. Manuel Castillo-Cara Data Analytics con R 4/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

3 Analizar e interpretar un conjunto de datos y la correlación entre ellos


para mejorar las predicciones.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

3 Analizar e interpretar un conjunto de datos y la correlación entre ellos


para mejorar las predicciones.

4 Comprender y analizar la fase del análisis de datos previos al modelado


algorı́tmico en machine learning.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

3 Analizar e interpretar un conjunto de datos y la correlación entre ellos


para mejorar las predicciones.

4 Comprender y analizar la fase del análisis de datos previos al modelado


algorı́tmico en machine learning.

5 Realizar modelos algorı́tmicos robustos con una optimización de sus


hiperparámetros para la fase de predicción.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

3 Analizar e interpretar un conjunto de datos y la correlación entre ellos


para mejorar las predicciones.

4 Comprender y analizar la fase del análisis de datos previos al modelado


algorı́tmico en machine learning.

5 Realizar modelos algorı́tmicos robustos con una optimización de sus


hiperparámetros para la fase de predicción.

6 Realizar modelos algorı́tmicos robustos y evaluar su desempeño en la


fase de forecasting.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

3 Analizar e interpretar un conjunto de datos y la correlación entre ellos


para mejorar las predicciones.

4 Comprender y analizar la fase del análisis de datos previos al modelado


algorı́tmico en machine learning.

5 Realizar modelos algorı́tmicos robustos con una optimización de sus


hiperparámetros para la fase de predicción.

6 Realizar modelos algorı́tmicos robustos y evaluar su desempeño en la


fase de forecasting.

7 Desarrollar y analizar proyectos de machine learning en problemas


regresión y clasificación binaria y multiclase.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo
Datos generales
Machine learning
Sumilla
La plataforma R

Competencias

1 Aprender las técnicas de modelado predictivo con R.

2 Comprender que es la minerı́a de datos y aplicarla a un conjunto de


datos especı́fico.

3 Analizar e interpretar un conjunto de datos y la correlación entre ellos


para mejorar las predicciones.

4 Comprender y analizar la fase del análisis de datos previos al modelado


algorı́tmico en machine learning.

5 Realizar modelos algorı́tmicos robustos con una optimización de sus


hiperparámetros para la fase de predicción.

6 Realizar modelos algorı́tmicos robustos y evaluar su desempeño en la


fase de forecasting.

7 Desarrollar y analizar proyectos de machine learning en problemas


regresión y clasificación binaria y multiclase.

Dr. Manuel Castillo-Cara Data Analytics con R 5/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Contenidos

1 Silabo
Datos generales
Sumilla

2 Machine learning
Definición
Nuestro curso
Temario

3 La plataforma R
Por qué utilizar R
Qué es R
Consejos

Dr. Manuel Castillo-Cara Data Analytics con R 6/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Definición

Machine Learning trata sobre la construcción de algoritmos que pueden


aprender y hacer predicciones con datos; básicamente algoritmos que
aprendan con la experiencia.

Según Expertos

Arthur Samuel (1954) Machine Learning: “Área de estudio que les da a


las computadoras la habilidad de aprender sin necesidad de ser
explı́citamente programadas”.

Dr. Manuel Castillo-Cara Data Analytics con R 7/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Definición

Machine Learning trata sobre la construcción de algoritmos que pueden


aprender y hacer predicciones con datos; básicamente algoritmos que
aprendan con la experiencia.

Según Expertos

Arthur Samuel (1954) Machine Learning: “Área de estudio que les da a


las computadoras la habilidad de aprender sin necesidad de ser
explı́citamente programadas”.

Según Tom M. Mitchel (1998): “a un programa de computadora se le


indica aprender de la experiencia E con respecto a alguna tarea T y
alguna medida de desempeño P, si su rendimiento sobre T, medido por
P, mejora con la experiencia de E.

Dr. Manuel Castillo-Cara Data Analytics con R 7/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Definición

Machine Learning trata sobre la construcción de algoritmos que pueden


aprender y hacer predicciones con datos; básicamente algoritmos que
aprendan con la experiencia.

Según Expertos

Arthur Samuel (1954) Machine Learning: “Área de estudio que les da a


las computadoras la habilidad de aprender sin necesidad de ser
explı́citamente programadas”.

Según Tom M. Mitchel (1998): “a un programa de computadora se le


indica aprender de la experiencia E con respecto a alguna tarea T y
alguna medida de desempeño P, si su rendimiento sobre T, medido por
P, mejora con la experiencia de E.

Dr. Manuel Castillo-Cara Data Analytics con R 7/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Simplemente es...

Figure: Máquina que aprende. Fuente: Toptal.

Dr. Manuel Castillo-Cara Data Analytics con R 8/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Rompiendo mitos

No hay que ser bueno con las matemáticas.

No hay que ser buenos programadores.

Dr. Manuel Castillo-Cara Data Analytics con R 9/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Rompiendo mitos

No hay que ser bueno con las matemáticas.

No hay que ser buenos programadores.

Nos encontramos en la temática llamada modelado predictivo dentro del


machine learning.

Dr. Manuel Castillo-Cara Data Analytics con R 9/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Rompiendo mitos

No hay que ser bueno con las matemáticas.

No hay que ser buenos programadores.

Nos encontramos en la temática llamada modelado predictivo dentro del


machine learning.

¿Diferencia entre estadı́stica tradicional y modelado predictivo? ¿Donde


estamos nosotros?

Dr. Manuel Castillo-Cara Data Analytics con R 9/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Rompiendo mitos

No hay que ser bueno con las matemáticas.

No hay que ser buenos programadores.

Nos encontramos en la temática llamada modelado predictivo dentro del


machine learning.

¿Diferencia entre estadı́stica tradicional y modelado predictivo? ¿Donde


estamos nosotros?

Estadı́stica tradicional
Tiene la funcionalidad principal de llegar a comprender los datos.

Dr. Manuel Castillo-Cara Data Analytics con R 9/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Rompiendo mitos

No hay que ser bueno con las matemáticas.

No hay que ser buenos programadores.

Nos encontramos en la temática llamada modelado predictivo dentro del


machine learning.

¿Diferencia entre estadı́stica tradicional y modelado predictivo? ¿Donde


estamos nosotros?

Estadı́stica tradicional
Tiene la funcionalidad principal de llegar a comprender los datos.

Modelado predictivo
Técnica que tiene por objeto descubrir patrones de comportamiento de
nuestros datos, en este caso tabulares como hojas de cálculo, para tener
predicciones más precisas.
Dr. Manuel Castillo-Cara Data Analytics con R 9/19
Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Rompiendo mitos

No hay que ser bueno con las matemáticas.

No hay que ser buenos programadores.

Nos encontramos en la temática llamada modelado predictivo dentro del


machine learning.

¿Diferencia entre estadı́stica tradicional y modelado predictivo? ¿Donde


estamos nosotros?

Estadı́stica tradicional
Tiene la funcionalidad principal de llegar a comprender los datos.

Modelado predictivo
Técnica que tiene por objeto descubrir patrones de comportamiento de
nuestros datos, en este caso tabulares como hojas de cálculo, para tener
predicciones más precisas.
Dr. Manuel Castillo-Cara Data Analytics con R 9/19
Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Primer bloque

1. Introducción

Conceptos básicos.

La plataforma R como nuestro entorno.

Dr. Manuel Castillo-Cara Data Analytics con R 10/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Primer bloque

1. Introducción

Conceptos básicos.

La plataforma R como nuestro entorno.

Conclusiones.

Dr. Manuel Castillo-Cara Data Analytics con R 10/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Primer bloque

1. Introducción

Conceptos básicos.

La plataforma R como nuestro entorno.

Conclusiones.

2. Programando con R

Primeros pasos con R.

Dr. Manuel Castillo-Cara Data Analytics con R 10/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Primer bloque

1. Introducción

Conceptos básicos.

La plataforma R como nuestro entorno.

Conclusiones.

2. Programando con R

Primeros pasos con R.

Lenguaje de programación R.

Dr. Manuel Castillo-Cara Data Analytics con R 10/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Primer bloque

1. Introducción

Conceptos básicos.

La plataforma R como nuestro entorno.

Conclusiones.

2. Programando con R

Primeros pasos con R.

Lenguaje de programación R.

Conjunto de datos estándar.

Dr. Manuel Castillo-Cara Data Analytics con R 10/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Primer bloque

1. Introducción

Conceptos básicos.

La plataforma R como nuestro entorno.

Conclusiones.

2. Programando con R

Primeros pasos con R.

Lenguaje de programación R.

Conjunto de datos estándar.

Dr. Manuel Castillo-Cara Data Analytics con R 10/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Segundo bloque

3. Análisis de datos

Cargar un conjunto de datos.

Estadı́stica descriptiva.

Dr. Manuel Castillo-Cara Data Analytics con R 11/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Segundo bloque

3. Análisis de datos

Cargar un conjunto de datos.

Estadı́stica descriptiva.

Visualización de datos.

4. Tratamiento de datos

Preprocesamiento de datos.

Dr. Manuel Castillo-Cara Data Analytics con R 11/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Segundo bloque

3. Análisis de datos

Cargar un conjunto de datos.

Estadı́stica descriptiva.

Visualización de datos.

4. Tratamiento de datos

Preprocesamiento de datos.

Métodos de remuestreo.

Dr. Manuel Castillo-Cara Data Analytics con R 11/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Segundo bloque

3. Análisis de datos

Cargar un conjunto de datos.

Estadı́stica descriptiva.

Visualización de datos.

4. Tratamiento de datos

Preprocesamiento de datos.

Métodos de remuestreo.

Evaluación de las métricas.

Dr. Manuel Castillo-Cara Data Analytics con R 11/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Segundo bloque

3. Análisis de datos

Cargar un conjunto de datos.

Estadı́stica descriptiva.

Visualización de datos.

4. Tratamiento de datos

Preprocesamiento de datos.

Métodos de remuestreo.

Evaluación de las métricas.

Dr. Manuel Castillo-Cara Data Analytics con R 11/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Rendimiento de los algoritmos.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Rendimiento de los algoritmos.

6. Fase de Optimización y Forecasting

Configuración de hiperparámetros.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Rendimiento de los algoritmos.

6. Fase de Optimización y Forecasting

Configuración de hiperparámetros.

Algoritmos de conjunto.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Rendimiento de los algoritmos.

6. Fase de Optimización y Forecasting

Configuración de hiperparámetros.

Algoritmos de conjunto.

Guardar y realizar predicciones.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Rendimiento de los algoritmos.

6. Fase de Optimización y Forecasting

Configuración de hiperparámetros.

Algoritmos de conjunto.

Guardar y realizar predicciones.

Plantilla para el modelado predictivo.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Tercer bloque

5. Fase de modelado

Feature Selection.

Algoritmos de Machine Learning.

Rendimiento de los algoritmos.

6. Fase de Optimización y Forecasting

Configuración de hiperparámetros.

Algoritmos de conjunto.

Guardar y realizar predicciones.

Plantilla para el modelado predictivo.

Dr. Manuel Castillo-Cara Data Analytics con R 12/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Cuarto bloque

7. Proyectos en machine learning

Problema de clasificación multiclase.

Problema de regresión.

Dr. Manuel Castillo-Cara Data Analytics con R 13/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Cuarto bloque

7. Proyectos en machine learning

Problema de clasificación multiclase.

Problema de regresión.

Problema de clasificación binaria.

Dr. Manuel Castillo-Cara Data Analytics con R 13/19


Silabo Definición
Machine learning Nuestro curso
La plataforma R Temario

Cuarto bloque

7. Proyectos en machine learning

Problema de clasificación multiclase.

Problema de regresión.

Problema de clasificación binaria.

Dr. Manuel Castillo-Cara Data Analytics con R 13/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Contenidos

1 Silabo
Datos generales
Sumilla

2 Machine learning
Definición
Nuestro curso
Temario

3 La plataforma R
Por qué utilizar R
Qué es R
Consejos

Dr. Manuel Castillo-Cara Data Analytics con R 14/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Cinco caracterı́sticas principales

R es utilizado por los mejores cientı́ficos de datos del mundo.

Uno de los elementos más robustos que tiene el lenguaje de


programación R es la gran variedad de técnicas que ofrece los paquetes
de terceros (y que estudiaremos en este curso).

Dr. Manuel Castillo-Cara Data Analytics con R 15/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Cinco caracterı́sticas principales

R es utilizado por los mejores cientı́ficos de datos del mundo.

Uno de los elementos más robustos que tiene el lenguaje de


programación R es la gran variedad de técnicas que ofrece los paquetes
de terceros (y que estudiaremos en este curso).

Uno de los motivos principales del auge y consolidación del lenguaje R


es por la gran acogida en su uso y enseñanza por los académicos.

Dr. Manuel Castillo-Cara Data Analytics con R 15/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Cinco caracterı́sticas principales

R es utilizado por los mejores cientı́ficos de datos del mundo.

Uno de los elementos más robustos que tiene el lenguaje de


programación R es la gran variedad de técnicas que ofrece los paquetes
de terceros (y que estudiaremos en este curso).

Uno de los motivos principales del auge y consolidación del lenguaje R


es por la gran acogida en su uso y enseñanza por los académicos.

Otra caracterı́stica principal de su difusión y acogida es que el lenguaje


R es software de código abierto y multiplataforma.

Dr. Manuel Castillo-Cara Data Analytics con R 15/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Cinco caracterı́sticas principales

R es utilizado por los mejores cientı́ficos de datos del mundo.

Uno de los elementos más robustos que tiene el lenguaje de


programación R es la gran variedad de técnicas que ofrece los paquetes
de terceros (y que estudiaremos en este curso).

Uno de los motivos principales del auge y consolidación del lenguaje R


es por la gran acogida en su uso y enseñanza por los académicos.

Otra caracterı́stica principal de su difusión y acogida es que el lenguaje


R es software de código abierto y multiplataforma.

R es divertido, fácil de usar y de gran rendimiento. Es un lenguaje tipo


scripting.

Dr. Manuel Castillo-Cara Data Analytics con R 15/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Cinco caracterı́sticas principales

R es utilizado por los mejores cientı́ficos de datos del mundo.

Uno de los elementos más robustos que tiene el lenguaje de


programación R es la gran variedad de técnicas que ofrece los paquetes
de terceros (y que estudiaremos en este curso).

Uno de los motivos principales del auge y consolidación del lenguaje R


es por la gran acogida en su uso y enseñanza por los académicos.

Otra caracterı́stica principal de su difusión y acogida es que el lenguaje


R es software de código abierto y multiplataforma.

R es divertido, fácil de usar y de gran rendimiento. Es un lenguaje tipo


scripting.

Dr. Manuel Castillo-Cara Data Analytics con R 15/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Definiciones oficiales

Proyecto R

“R es ‘GNU’, un lenguaje y entorno de libre disposición para la


computación estadı́stica y los gráficos que proporciona una amplia
variedad de técnicas estadı́sticas y gráficas: modelado lineal y no
lineal, pruebas estadı́sticas, análisis de series de tiempo,
clasificación, agrupamiento, etc.”

Proyecto CRAN

“CRAN es una red de servidores FTP y web de todo el mundo que


almacena versiones idénticas y actualizadas de código y
documentación para R.”

Dr. Manuel Castillo-Cara Data Analytics con R 16/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Definiciones oficiales

Proyecto R

“R es ‘GNU’, un lenguaje y entorno de libre disposición para la


computación estadı́stica y los gráficos que proporciona una amplia
variedad de técnicas estadı́sticas y gráficas: modelado lineal y no
lineal, pruebas estadı́sticas, análisis de series de tiempo,
clasificación, agrupamiento, etc.”

Proyecto CRAN

“CRAN es una red de servidores FTP y web de todo el mundo que


almacena versiones idénticas y actualizadas de código y
documentación para R.”

Dr. Manuel Castillo-Cara Data Analytics con R 16/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Conceptos principales

R es un lenguaje de programación tipo script, por lo que es muy sencillo


y directo.

R es un intérprete. Puedes escribir scripts y guardarlos como archivos.

Dr. Manuel Castillo-Cara Data Analytics con R 17/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Conceptos principales

R es un lenguaje de programación tipo script, por lo que es muy sencillo


y directo.

R es un intérprete. Puedes escribir scripts y guardarlos como archivos.

R es también una plataforma. Puede ser usada para crear y mostrar


gráficos, para guardar y cargar el estado y para interactuar con otros
sistemas.

Dr. Manuel Castillo-Cara Data Analytics con R 17/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Conceptos principales

R es un lenguaje de programación tipo script, por lo que es muy sencillo


y directo.

R es un intérprete. Puedes escribir scripts y guardarlos como archivos.

R es también una plataforma. Puede ser usada para crear y mostrar


gráficos, para guardar y cargar el estado y para interactuar con otros
sistemas.

Dr. Manuel Castillo-Cara Data Analytics con R 17/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Consejos al utilizar R

Paquetes de R

R en sı́ es muy simple. Proporciona comandos integrados para


estadı́sticas básicas y manejo de datos.
Los paquetes de terceros son complementos a la plataforma R. Hay que
verificar que sean paquetes bien acogidos por la comunidad.
Si ya está implementado y validado por la comunidad reutilizarlos.

¿R para cualquier ámbito?

El desarrollo de modelos robustos para producción no es la mejor


solución.
Necesitamos usar los mejores principios de ingenierı́a de software,
realizar pruebas o ser escalables al tamaño de los conjuntos de datos
elevados los cuales R tiene sus limitaciones.

Dr. Manuel Castillo-Cara Data Analytics con R 18/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Consejos al utilizar R

Paquetes de R

R en sı́ es muy simple. Proporciona comandos integrados para


estadı́sticas básicas y manejo de datos.
Los paquetes de terceros son complementos a la plataforma R. Hay que
verificar que sean paquetes bien acogidos por la comunidad.
Si ya está implementado y validado por la comunidad reutilizarlos.

¿R para cualquier ámbito?

El desarrollo de modelos robustos para producción no es la mejor


solución.
Necesitamos usar los mejores principios de ingenierı́a de software,
realizar pruebas o ser escalables al tamaño de los conjuntos de datos
elevados los cuales R tiene sus limitaciones.

Dr. Manuel Castillo-Cara Data Analytics con R 18/19


Silabo Por qué utilizar R
Machine learning Qué es R
La plataforma R Consejos

Manos a la obra

Figure:
Dr. Manuel Castillo-Cara Data Analytics con R 19/19