Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto 1
Proyecto 1
Integrantes:
Bogotá D.C.
Análisis exploratorio
1) Detalle en una tabla del tipo de variable y la escala de medida de cada una de las 15 variables.
YEAR
TITLE
IMDB ID
IMDB TITLE
IMDB YEAR
KIND
GENRES
COUNTRIES
IMDB
RATING
IMDB VOTES
LANGUAGES
RUNTIMES
CERTIFICATE
S
NUMBER OF
SEASONS
1) ¿ Tiene relación el rating con el número de votos ?
VOTOS VS RATING
25000000
20000000
15000000
10000000
5000000
0
0 20 40 60 80 100 120
A partir de la tabla anterior podemos decir que el rating y los votos tienen una relación
parcialmente directa, ya que el rating dependerá de la cantidad de votantes, a mayor cantidad de
votantes (Buenos votos, malos votos) en una serie o película el rating será mayor o menor, para
este caso observamos que entre más votos mayor será el rating. Esta relación se aprecia más en el
rango de puntuación de 60-95.
Utilidad: Gracias a esto podemos concluir si el numero de votos pueden inferir en el rating del
programa o serie.
2) ¿ La media y la mediana que nos pueden decir sobre rating ?
Gracias a la tabla de datos sobre el rating, podemos obtener que las películas con más
rating y las películas con menos rating, las cuales fueron:
Películas con mayor rating:
The Chosen
A Night to Remember
Peliculas con menor rating:
Por medio del Boxplot realizado, podemos afirmar que al menos el 75% de las películas se
encuentran en una puntuación de rating de 60.
Observando el primer 25% del boxplot, podemos concluir que las películas ubicadas en
este porcentaje están en el rating entre 10-30.
Observando los datos atípicos podemos concluir que algunas de las películas y/o series de
Netflix aun no han obtenido rating o no obtuvieron.
Gracias a la mediana podemos concluir la película que se encuentra en la mitad del rating
es:
Acá podemos observar que el mínimo esta entre 10 y 15 el cual su frecuencia fue de 6 y el máximo
del rating esta entre 95 y 100 donde su frecuencia fue de 7.
Gracias al histograma anterior podemos inferir que los años de más producción de contenido en
Netflix se encuentran entre 2001 a 2005.
5) ¿Cuál fue el formato más famoso y menos famoso en Netflix?
A partir de la tabla de frecuencia y el histograma anterior podemos observar que las mini series de
televisión son las menos famosas, contrario a esto obtenemos que las películas vendrían siendo el
contenido más visto(famoso).
Gracias a las grafica podemos observar que no hay una relación directa entre el rating y el tiempo
de duración.
8) ¿Cual es el genero mas famoso ?
Gracias al histograma que generamos gracias a la base de datos podemos observar que el género
más visto o popular es el de crimen.