Está en la página 1de 14

  

  
  

   UNIVERSIDAD DEL VALLE DE MÉXICO  

HERRAMIENTAS ESTADISTICAS PARA ANALISIS


DATOS   

Domingo 7 de noviembre 2021  
  

Actividad 1.
Proyecto Integrador Etapa 1

Docente:
Dr. Ing. Jorge Eduardo Esquerre Verastegui

Integrantes:  
 GARCIA MARTINEZ JUAN ANTONIO  

  

CDMX
Actividad 1. Proyecto Integrador Etapa 1

Objetivo
Este documento está diseñado para describir cómo descargar y configurar R en una
computadora personal. Esta descripción aborda el funcionamiento de Windows sistema,
pero podría modificarse para discutir el Macintosh OS X y Unix plataformas.

Instalando R
El primer paso para convertirte en un analista o científico de datos es tener R instalado en
tu ordenador. R se puede descargar libremente de su página oficial. Ten en cuenta que la
instalación requiere hasta 150 MB de espacio de almacenamiento en disco disponible. La
página web oficial del proyecto R es la siguiente:
Proceso para instalar R:
Ir a la web oficial del proyecto,
Descargar el R,
Instalar en nuestra computadora, e Iniciar el programa para probar que todo esté en orden.
1. Descargar e instalar R página para instalar r base 3.5.3 en Windows
Seguir el proceso de instalación

1. Hacemos doble click en el instalador de R,


2. Ejecutar, seleccionamos “sí”, para dar los permisos y que se instale R,
3. escogemos español, siguiente para la licencia, escogemos la carpeta, todos los
componentes, «no” a las opciones de configuración, la carpeta R tal cual está, en
tareas adicionales si queremos tener el acceso directo a R le damos a “crear icono en
el escritorio”, finalizar.
4. Luego, podemos probar que todo está bien abriendo R y escribiendo en la consola.
2. Descarga de la siguiente dirección http://ipsur.org/install.html el paquete IIPSUR y
asegurarte de realizar su instalación.
Instalar IPSUR package
Inicie R y escriba lo siguiente en el símbolo del sistema ">":
install. packages ("IPSUR", dependencias = TRUE)
¿Qué es un data frame?

Los dataframes son una clase de objetos especial en R. Normalmente, cuando se realiza un
estudio estadístico sobre los sujetos u objetos de una muestra, la información se organiza
precisamente en un dataframe: una hoja de datos, en los que cada fila corresponde a un
sujeto y cada columna a una variable.

Propiedades de un data frame

Al igual que con una matriz, si aplicamos una operación aritmética a un data frame, esta se
vectorizará. Los resultados que obtendremos dependerán del tipo de datos de cada columna.
R nos devolverá todas las advertencias que ocurran como resultado de las operaciones
realizadas, por ejemplo, aquellas que hayan requerido una coerción.

Que es un diagrama de caja y bigotes (BoxPlot)

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos
muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical
que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles
primero y tercero (recordemos que el segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo
y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos
bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se
encuentre dentro de este rango es marcado e identificado individualmente
Ejemplificar los cuantiles

El Cuartil (Qn) es una medida estadística que se utiliza para indicar el valor por debajo del
cual se encuentra un determinado porcentaje de observaciones.

Cada cuartil representa un 25% hasta llegar a 100% siendo 100% el total de las muestras
analizadas:

 Cuartil 1 (Q1): valor que es superior al del 25% de las muestras más bajas
 Cuartil 2 (Q2): valor que es superior al del 50% de las muestras más bajas
 Cuartil 3 (Q3): valor que es superior al del 75% de las muestras más bajas
 Cuartil 4 (Q4): valor más alto

Ejemplificar lo que es un factor


Un factor es una variable categórica con un número finito de valores o niveles. En R los
factores se utilizan habitualmente para realizar clasificaciones de los datos, estableciendo su
pertenencia a los grupos o categorías determinados por los niveles del factor.

Los factores juegan un papel muy importante en la elaboración de modelos estadísticos. En


particular, los modelos lineales pueden dar resultados muy diferentes según que una
variable se declare como numérica o como factor.

Hay algunas funciones en R que requieren que la variable de entrada sea necesariamente un
factor (aun cuando la variable esté codificada numéricamente). Para ello basta recodificar la
variable original como factor. Por ejemplo, supongamos que se ha registrado la producción
de tres máquinas (identificadas como 27, 32 y 55) durante cinco días sucesivos, dando
como resultado los siguientes datos:
5. Asegúrate de contar con la base de datos usedcars.csv y un directorio de
trabajo setwd (“C:/…)
6. Lee base de datos 

usedcars.csv (coches_usados <- read.csv ("usedcars.csv", stringsAsfactor="FALSE)

7. Identifica las variables que tiene esta base de datos

str(coches_usados)
7. Visualiza las dimensiones

dim(coches_usados)

Visualiza los primeros 5 registros

coches_usados [1:5,]

8. Convierte las variables color, transmisión y modelo en factor (explica por qué se
debe hacer)

coches_usados$color <- as. factor(coches_usados$color)


9. Explora en la base de datos los primeros y últimos registros

head(coches_usados)

tail(coches_usados)

10. Identifica las variables numéricas a partir de las cuales puedas obtener algunos
datos estadísticos.

Utiliza la función: summary(coches_usados$price)

summary (coches_usados [c ("price", "mileage")])


11. Obtén los cuartiles de precio.

quantile(coches_usados$price)

12. Obtén el diagrama de caja y bigotes.

boxplot (coches_usados$price, main="Boxplot of Used Car Prices",

ylab="Price ($)")
13. Obtén la tabla de frecuencia de las variables nominales o categóricas (factor).

frecCol <-table(coches_usados$color)

barplot(frecCol)

Desplegar los datos de las tablas por proporciones

prop.table(frecCol)
Conclusiones:
La presente actividad ha demostrado ser muy útil para el conocimiento de la Herramienta R
y el estudio estadístico de las funciones básicas. Adicional la implementación de los
paquetes como extensiones para la adiciones de nuevas funciones en el programa, La
condición de profundidad en nuevas gráficas y así conocer puntos críticos en diversas
muestras,
Bibliografía
Y.S.U. (s. f.). What RcmdrPlugin.IPSUR Does: https://ipsur.r-forge.r-
project.org/rcmdrplugin/installation.php. Recuperado 7 de noviembre de
2021, de https://ipsur.r-forge.r-project.org/rcmdrplugin/installation.php

Kerns, G. (2010). Introduction to Probability and Statistics Using R (5nd ed.)


[Archivo PDF]. Recuperado de https://cran.r-
project.org/web/packages/IPSUR/vignettes/IPSUR.pdf

UCLA ENGINEERING Computer Science. Basic Data Analysis through R/R


Studio. Recuperado de http://web.cs.ucla.edu/~gulzar/rstudio/basic-tutorial.html

Kerns, G. (2010). Introduction to Probability and Statistics Using R (5nd ed.).


[Archivo PDF] Recuperado de https://cran.r-
project.org/web/packages/IPSUR/vignettes/IPSUR.pdf

También podría gustarte