Está en la página 1de 15

UNIVERSIDAD ESTATAL DE MILAGRO

PROBABILIDAD Y ESTADISTICA

ING: TORRES ORDOÑEZ LUIS HENRY

TRABAJO PRACTICO DE INVESTIGACIÓN

INTEGRANTES DEL GRUPO


• DAVE ALEXANDER CLAVIJO NARANJO
• DANIEL ANTONIO ESPINOZA FLORES
• ANTHONY JUNIOR RAMIREZ RONQUILLO
FECHA 20/07/2022
1. Carga de Base de Datos: Descargue una base de datos cualquiera que tenga las siguientes condiciones y cargue
el conjunto de datos en el paquete R

a) 13580 observacion
b) 13 variable
c) 10 categoricas

#PASO 1 Carga de Base de Datos:


download.file("https://raw.githubusercontent.com/
esabunor/MLWorkspace/master/melb_data.csv",
"melb_data.csv")melbourne_data <-
read.csv("melb_data.csv")summary(melbourne_data)
2. Identificación de conceptos: parámetros, población, muestra, estimadores y tipo de variables de análisis:

Utilizando la información del conjunto de datos, identifique lo siguiente:


Población de estudio:
Muestra obtenida:
Variable_1: Tipo de dato
Variable_2: Tipo de dato

#PASO 2 identificación de concepto :


set.seed(1)
muestra_se<sample(18396,110,replace=F)
View(muestra_se)
orden_mu<sort(muestra_se)
Data110<melbourne_data[orden_mu,]
View(Data110)
3. Muestreo: De la base de datos original (punto 1), realice un muestreo de mínimo 110 observaciones dándole otro
nombre a la nueva base de datos muestreada. (sugerencia: realice un muestreo aleatorio simple)

Población de estudio: 18396


Muestra obtenida:110
Variable 1: x -> carácter
Variable 2: Suburb -> carácter
Variable 3: Address -> carácter
Variable 4: Rooms -> numérico
Variable 5: Type -> carácter
Variable 6: Price -> numérico
Variable 7: Method -> carácter
Variable 8: SellerG -> carácter
Variable 9: Date-> carácter
Variable 10: Distance-> numérico
Variable 11: Postcode-> numérico
Variable 12: Bedroom2 -> numérico
Variable 13: Bathroom -> numérico
Variable 14: Car-> numérico
Variable 15: Landsize -> numérico
Variable 16: BuildingArea -> numérico
Variable 17: YearBuilt -> numérico
Variable 18: CouncilArea -> carácter
Variable 19: Lattitude -> numérico
Variable 20: Longitude -> numérico
Variable 21: Regionname -> carácter
Variable 22: Propertycount -> numérico
4. Análisis gráfico y medidas descriptivas de datos cuantitativos. De la base de datos muestreada (punto3),
Para cada una de las variables cuantitativas anteriores, realice sus respectivas gráficas y desarrolle un análisis
exploratorio o descriptivo de los resultados obtenidos. (Medidas de tendencia central, medidas de dispersión,
medidas de posición, medidas de forma)

#PASO 4 Análisis gráfico y medidas descriptivas de datos


cuantitativoshist(melbourne_data$Bedroom2)summary(melbo
urne_data)
Análisis de los resultados obtenidos:
De acuerdo con los datos obtenidos podemos notar que la variable “Price” (precio) varían entre el Mínimo de :
85000, llegando a un Máximo de 9000000.
GRAFICO # 1
Histograma:
Análisis de los resultados obtenidos:
De acuerdo con los datos obtenidos podemos notar que la variable “Rooms” (Habitaciones) varían entre el Mínimo de :
1.000, llegando a un Máximo de 12.000.
GRAFICO # 2
Histograma:
Análisis de los resultados obtenidos:
De acuerdo con los datos obtenidos podemos notar que la variable “Dintance” (Distancia) varían entre el Mínimo
de : 0.00, llegando a un Máximo de 48.10.
GRAFICO # 3
Histograma:
Análisis de los resultados obtenidos:
De acuerdo con los datos obtenidos podemos notar que la variable “Rooms” (Habitaciones) varían entre el
Mínimo de : 3000, llegando a un Máximo de 3978.

Histograma: GRAFICO # 3
5. Análisis gráfico y medidas descriptivas de datos cualitativos o categóricos.

#PASO 5 Análisis gráfico y medidas descriptivas de datos cualitativos o categóricos.


install.packages('epiDisplay')library(epiDisplay)print(tab1(melbourne_data$cuartos,
sort.group = "decreasing", cum.percent = TRUE))
6) Tablas cruzadas o de contingencia # PASO 6 Tablas cruzadas o de contingencia
melbourne_data$antiguedad <- as.factor(
ifelse(
melbourne_data$YearBuilt<1980,
"Antigua",
ifelse(
melbourne_data$YearBuilt<2000,
"Vieja",
"Moderna"
)
)
)
melbourne_data$cuartos <- as.factor(
ifelse(
melbourne_data$Rooms<2,
"Pocos cuartos",
ifelse(
melbourne_data$Rooms<5,
"Normal cuartos",
"Muchos cuartos" ) ))contigencia <-
table(melbourne_data$antiguedad,
melbourne_data$cuartos)print(contigencia)
REFERENCIA

Gunjan Pathak. (2018). KAGGLE . Obtenido de


https://www.kaggle.com/datasets/gunjanpathak/melb-data
OBSERVACION
Este trabajo fue solamente realizado por: DAVE ALEXANDER CLAVIJO NARANJO, DANIEL ANTONIO ESPINOZA
FLORES y ANTHONY JUNIOR RAMIREZ RONQUILLO , mientras que el ultimo integrante de mi grupo no aportó
nada al realizar el trabajo al cual notifique pero no me dio respuesta.

También podría gustarte