Está en la página 1de 15

Curso 1: Introducción a Data Science

Prof. Rolando de la Cruz


CONTENIDOS
► Crear directorio de trabajo
► Cambiar directorio de trabajo
► Archivos y carpetas del directorio de trabajo
► Tipos de datos. Datos más comunes
► Coerción. Coerción explicita
► Verificar tipo de un dato: familia de funciones as() e is()
► Estructuras de datos
Directorio de trabajo

► El directorio, área o carpeta de trabajo es el lugar en nuestro


computador en el que se encuentran los archivos con los que estamos
trabajando en R. Este es el lugar donde R buscara archivos para
importarlos y al que serán exportados, a menos que indiquemos otra
cosa.

► Para saber cuál es el directorio de trabajo podemos usar la función:


getwd()
Cambiar directorio de trabajo

► Se puede cambiar el directorio de trabajo usando la función setwd(),


dando como argumento la ruta del directorio que quieres usar.

► Por ejemplo: setwd("~/Dropbox/Cursos/Curso1")


Listar objetos del directorio de trabajo
► Todas los objetos creados quedan en el directorio de trabajo. Para listarlos
se usa el función objects() o ls(). Para borrar una variable usamos rm():

# Listar objetos del workspace


objects()
ls()
# borro el objeto x
rm(x)
ls()
#Para borrarlos todos
rm(list=ls()) #usarlo con cuidado
ls()
Guardar directorio de trabajo

► Puedo grabar todas mis objetos del workspace en un archivo con la


función save.image() y así recuperar mi trabajo en una sesión
futura con la función load():

# Guardamos workspace
save.image(”Untitled.RData")
# Luego lo cargamos
load("Untitled.RData")

Nota: para guardar y cargar los objetos del workspace hay que estar
posicionado en el directorio de trabajo.
Archivos y carpetas del directorio de trabajo

► Si deseas conocer el contenido de tu directorio de trabajo, puedes


ejecutar la función list.files(), sin argumentos, que devolverá
una lista con el nombre de los archivos de tu directorio de trabajo.

► La función list.dirs(), también sin argumentos muestra una lista


de las carpetas dentro del directorio de trabajo.
Tipos de datos

► En R los datos pueden ser de diferentes tipos.


► Cada tipo tiene características particulares que lo distinguen de los
demás.
► Entre otras cosas algunas operaciones sólo pueden realizarse con tipos
de datos específicos
Datos más comunes

Tipo Ejemplo Nombre en inglés


Entero 20 integer
Numérico 53.18 numeric
Cadena de texto “mujer” character
Factor mujer factor
Lógico TRUE logical
Perdido (missing data) NA NA
Vacío NULL NULL
Coerción

► En R, los datos pueden ser coercionados, es decir, forzados, para


transformarlos de un tipo a otro.
► La coerción es muy importante. Cuando pedimos a R ejecutar una
operación, intentará coercionar de manera implícita, sin avisarnos, los
datos de su tipo original al tipo correcto que permita realizarla. Habrá
ocasiones en las que R tenga éxito y la operación ocurra sin problemas, y
otras en las que falle y obtengamos un error.
► Orden de coerción:
logical -> integer -> numeric -> character
Coerción explícita con la función as()

Tipo Tipo al que hace coerción


as.integer() integer
as.numeric() numeric
as.character() character
as.factor() factor
as.logical() logical
as.null() NULL
Verificar el tipo de un dato

► ¿Cómo verificamos qué tipo de datos tenemos?


► Para esto casos, podemos usar la
función class() para determinar el tipo de un
dato.

► Esto es de utilidad para asegurarnos que las


operaciones que deseamos realizar tendrán los
datos apropiados para llevarse a cabo con éxito.
Verificar el tipo de un dato con la familia de funciones is()

► Podemos verificar si un dato es de un tipo


específico con la familia de funciones is()

Tipo Tipo que verifican


is.integer() integer
is.numeric() numeric
is.character() character
is.factor() factor
is.logical() logical
is.null() NULL
Estructuras de Datos

► Las estructuras de datos son objetos que contienen datos. Cuando


trabajamos con R, lo que estamos haciendo es manipular estas
estructuras.
► Las estructuras tienen diferentes características. Entre ellas, las que
distinguen a una estructura de otra son su número de dimensiones y si
son homogeneas o hereterogeneas.

Dimensiones Homogéneas Heterogéneas


1 Vector Lista
2 Matriz Data Frame
n Array
Curso 1: Introducción a Data Science

Prof. Rolando de la Cruz

También podría gustarte