Está en la página 1de 3

Propuesta de análisis de preferencias de películas de

Disney+
Fiorella Henriquez C
Data Science Research Peru
Lima, Peru
fiorella1605@gmail.com

XXX-X-XXXX-XXXX-X/XX/$XX.00 ©20XX IEEE


Abstract— En este artículo se presenta la propuesta de de aprendizaje (supervisado, no supervisado), qué
construcción de un producto basado en datos para determinar tipo de modelo (segmentación, regresión,
las variables que impactan las preferencias de los suscriptores clasificación) y si también se conoce el tipo
de Disney+ a sus programas disponibles, se evaluará la específico (árbol de decisión, regresión linear) –
hipótesis que XYZ origina los resultados ABC, el cual será como opcional.
validado mediante análisis descriptivo de datos y técnicas de
visualización, con el objetivo de ejecutar un plan de marketing  Qué técnicas se podrían usar para la evaluación del
para mejorar el engagement de los suscriptores en Perú. Como modelo (validación cruzada, métricas de evaluación
complemento a los hallazgos encontrados, se incluye la de error, etc)
propuesta de desarrollo de un modelo de machine learning
 Qué herramientas se podrían usar (software, tableros
Keywords—Python, análisis, estadística, machine learning, de visualización, lenguajes de programación) para los
product, datos. diferentes pasos. Y dónde se podría desplegar (web,
API, reporte, presentación a una audiencia, tablero de
I. INTRODUCCIÓN
visualización, etc.)
Aquí podemos incluir el contexto del problema, los
antecedentes averiguados, por qué es importante el problema,
por qué se plantea un producto basado en datos y cómo V. BENEFICIOS
ayudaría dicho producto, así como qué metodología de
proyecto se usará (CRISP-DM). Detallar qué beneficios podría traer el data product
(datos, análisis, modelamiento) y cómo ayuda el método de
II. DEFINICIÓN DEL PROBLEMA despliegue a dicho objetivo. A quién impactará y qué
Detallar qué problema se va a resolver, por qué es acciones podrá tomar con este producto basado en datos.
importante y cuál es el contexto en el cual se da el problema. Quiénes serán impactados de forma indirecta.
Incluir también a quién afecta el problema (personas,
organización, roles), cómo lo afecta, qué se lograría si se
resuelve, en qué proceso de negocio está ubicado el VI.PLAN DE PROYECTO
problema y cuáles son las hipótesis que tenemos de cómo se Detallar cómo se plantearía el desarrollo del proyecto,
podría resolver. tomando en cuenta las fases de la metodología CRISP-DM.
III. TRABAJOS RELACIONADOS
Qué se debería tomar en cuenta para el inicio del proyecto:
recordar el modelo 50% personas-30% procesos-20%
A. Estudio encontrado 1 producto. Cuánto tiempo aproximado (en meses, semanas)
Detalles del análisis, estudio, modelo de machine podría tomar cada etapa. Qué recursos se pueden necesitar:
learning o experimento encontrado como antecedente. qué perfiles y por qué (data engineer, data scientist, data
Analyst). En qué costos se podrían incurrir para la ejecución:
B. Estudio encontrado 2 van relacionados a si tenemos que comprar alguna licencia
Detalles del análisis, estudio, modelo de machine de software, implementar una base de datos en pequeña o
learning o experimento encontrado como antecedente. gran escala, capacidad de procesamiento, contratación de
personal permanente o temporal, compra de set de datos, etc.
C. Estudio encontrado 3
Detalles del análisis, estudio, modelo de machine
learning o experimento encontrado como antecedente.

IV.PROPUESTA DE DATA PRODUCT REFERENCIAS


Aquí se detalla qué dataset se va a usar, de dónde se Incluir las citas bibliográficas en formato APA y usar los
extraerá y con qué metodologías y herramientas. Luego se números correspondientes dentro del texto. En la sección de
deben detallar cuáles serán las variables dentro del dataset trabajos relacionados deben incluirse todas las referencias
que se usarán y qué indicadores adicionales se buscan correspondientes.
calcular o incluir para el objetivo del estudio. Posteriormente
incluimos el análisis usado y/o modelo de machine learning
[1] G. Eason, B. Noble, and I. N. Sneddon, “On certain integrals of
y por qué se escogieron. Incluir también las metodologías y Lipschitz-Hankel type involving products of Bessel functions,” Phil.
herramientas que se podrían usar para los distintos Trans. Roy. Soc. London, vol. A247, pp. 529–551, April 1955.
procedimientos de datos (ETL) y análisis/modelamiento. (references)
[2] J. Clerk Maxwell, A Treatise on Electricity and Magnetism, 3rd ed.,
A. Set de datos vol. 2. Oxford: Clarendon, 1892, pp.68–73.
Se usó el set de datos de… Se capturará de… con las [3] I. S. Jacobs and C. P. Bean, “Fine particles, thin films and exchange
técnicas… Se necesitan transformar los datos con las anisotropy,” in Magnetism, vol. III, G. T. Rado and H. Suhl, Eds.
siguientes metodologías… Y se usarán las herramientas para New York: Academic, 1963, pp. 271–350.
extraerla o para guardarla… Por qué se usa ese set de datos. [4] K. Elissa, “Title of paper if known,” unpublished.
Qué otros datos se podrían integrar, pero no se tienen [5] R. Nicole, “Title of paper with only first word capitalized,” J. Name
Stand. Abbrev., in press.
disponibles, por qué se quisieran integrar.
[6] Y. Yorozu, M. Hirano, K. Oka, and Y. Tagawa, “Electron
B. Modelamiento y/o Análisis spectroscopy studies on magneto-optical media and plastic substrate
interface,” IEEE Transl. J. Magn. Japan, vol. 2, pp. 740–741, August
 Qué análisis se podría realizar y de qué tipo 1987 [Digests 9th Annual Conf. Magnetics Japan, p. 301, 1982].
(descriptivo, predictivo), se realizará visualización de [7] M. Young, The Technical Writer’s Handbook. Mill Valley, CA:
datos para evaluar XYZ variables. Se pueden ejecutar University Science, 1989.
modelos de machine learning de tipo ABC, qué tipo

También podría gustarte