Está en la página 1de 2

ANÁLISIS DE DATA SET (1,5 PUNTO) El siguiente dataset contiene datos

sobre el hundimiento del Titanic. La información que encontramos en este


dataset es la siguiente: edad del pasajero, número de cabina, puerta de
embarque, precio del billete, nombre del pasajero, número de parientes y/o
hijos, identificador del pasajero, clase del pasajero, género, número de
hermanos/esposas a bordo, superviviente, número de billete, título del
pasajero, numero de parientes/hijos + número de hermanos/esposas. Para
este dataset se pide. 1. Indica los tipos de variables que contiene (continuas,
categóricas, texto, imágenes). 2. Indica los tipos de datos de cada variable
(nominal, numérico, binario, ordinal, texto, imágenes).

1. Al realizar un análisis dentro del data set encontramos una variedad de


datos del barco titanic en las cuales especifican de forma general como
están conformaos los datos de las personas del titanic y de sus partes
para ellos encontramos que :

Variable continua: podemos adoptar cualquier valoren el marco de


un intervalo que ya está predeterminado. De acuerdo a los tipos de
datos que se encuentra n en el data set

Variable categórica: Encontramos que en el data set las variables edad,


sexo, male o genero las cuales las podemos identificar que son
variables clasificadas por categorías

Texto e imágenes: Aquí solo encontramos en el data set variable de


texto como por ejemplo el sexo o el género y en la cual no se evidencias
imágenes en el data set

2. Los tipos de datos que encontramos en el data set son:

Identificación del pasajero: tenemos una variable de tipo entero


Nombre: variable de tipo String
Supervivencia: de tipo int o entero
Numero de esposo o parientes: De tipo entero
Edad: de tipo entero o int
Cabina: String
Cuerpo: entero o int
Precios: entero o int
Puerta de embarque : String

También podría gustarte