Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Domingo 7 de noviembre 2021
Actividad 1.
Proyecto Integrador Etapa 1
Docente:
Dr. Ing. Jorge Eduardo Esquerre Verastegui
Integrantes:
GARCIA MARTINEZ JUAN ANTONIO
CDMX
Actividad 1. Proyecto Integrador Etapa 1
Objetivo
Este documento está diseñado para describir cómo descargar y configurar R en una
computadora personal. Esta descripción aborda el funcionamiento de Windows sistema,
pero podría modificarse para discutir el Macintosh OS X y Unix plataformas.
Instalando R
El primer paso para convertirte en un analista o científico de datos es tener R instalado en
tu ordenador. R se puede descargar libremente de su página oficial. Ten en cuenta que la
instalación requiere hasta 150 MB de espacio de almacenamiento en disco disponible. La
página web oficial del proyecto R es la siguiente:
Proceso para instalar R:
Ir a la web oficial del proyecto,
Descargar el R,
Instalar en nuestra computadora, e Iniciar el programa para probar que todo esté en orden.
1. Descargar e instalar R página para instalar r base 3.5.3 en Windows
Seguir el proceso de instalación
Los dataframes son una clase de objetos especial en R. Normalmente, cuando se realiza un
estudio estadístico sobre los sujetos u objetos de una muestra, la información se organiza
precisamente en un dataframe: una hoja de datos, en los que cada fila corresponde a un
sujeto y cada columna a una variable.
Al igual que con una matriz, si aplicamos una operación aritmética a un data frame, esta se
vectorizará. Los resultados que obtendremos dependerán del tipo de datos de cada columna.
R nos devolverá todas las advertencias que ocurran como resultado de las operaciones
realizadas, por ejemplo, aquellas que hayan requerido una coerción.
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos
muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical
que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles
primero y tercero (recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo
y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos
bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se
encuentre dentro de este rango es marcado e identificado individualmente
Ejemplificar los cuantiles
El Cuartil (Qn) es una medida estadística que se utiliza para indicar el valor por debajo del
cual se encuentra un determinado porcentaje de observaciones.
Cada cuartil representa un 25% hasta llegar a 100% siendo 100% el total de las muestras
analizadas:
Cuartil 1 (Q1): valor que es superior al del 25% de las muestras más bajas
Cuartil 2 (Q2): valor que es superior al del 50% de las muestras más bajas
Cuartil 3 (Q3): valor que es superior al del 75% de las muestras más bajas
Cuartil 4 (Q4): valor más alto
Hay algunas funciones en R que requieren que la variable de entrada sea necesariamente un
factor (aun cuando la variable esté codificada numéricamente). Para ello basta recodificar la
variable original como factor. Por ejemplo, supongamos que se ha registrado la producción
de tres máquinas (identificadas como 27, 32 y 55) durante cinco días sucesivos, dando
como resultado los siguientes datos:
5. Asegúrate de contar con la base de datos usedcars.csv y un directorio de
trabajo setwd (“C:/…)
6. Lee base de datos
str(coches_usados)
7. Visualiza las dimensiones
dim(coches_usados)
coches_usados [1:5,]
8. Convierte las variables color, transmisión y modelo en factor (explica por qué se
debe hacer)
head(coches_usados)
tail(coches_usados)
10. Identifica las variables numéricas a partir de las cuales puedas obtener algunos
datos estadísticos.
quantile(coches_usados$price)
ylab="Price ($)")
13. Obtén la tabla de frecuencia de las variables nominales o categóricas (factor).
frecCol <-table(coches_usados$color)
barplot(frecCol)
prop.table(frecCol)
Conclusiones:
La presente actividad ha demostrado ser muy útil para el conocimiento de la Herramienta R
y el estudio estadístico de las funciones básicas. Adicional la implementación de los
paquetes como extensiones para la adiciones de nuevas funciones en el programa, La
condición de profundidad en nuevas gráficas y así conocer puntos críticos en diversas
muestras,
Bibliografía
Y.S.U. (s. f.). What RcmdrPlugin.IPSUR Does: https://ipsur.r-forge.r-
project.org/rcmdrplugin/installation.php. Recuperado 7 de noviembre de
2021, de https://ipsur.r-forge.r-project.org/rcmdrplugin/installation.php