Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los datos para este trabajo son dos hojas CSV llamadas selectcollections1.csv y
selectcollections2.csv.
Quiero que nombren este archivo con su numero de estudiante; por ejemplo 123456789.xlsx
(substituyendo 123456789 con su numero de estudiante de INCAE). No quiero nada mas que
esos 9 numeros. El que ignore esta instruccion le pondré 0 de calificacion. No me reclamen
despues.
1) Van a pronosticar cuanto puede cobrarse o recuperarse de cada cuenta en la base de datos
nueva.
2) Van a seleccionar que cuentas comprar de todas las contenidas en ese archivo.
3) Van, basados en las metricas de R-cuadrado y RMSE, a “pronosticar” que tan util creen
ustedes que seria su mejor modelo para ayudar a la empresa a hacer mejor su negocio.
Usted puede comprar cuantas cuentas usted desee por $850 cada una. Este valor es el
promedio de totalpay en la base de datos nueva. Usted no esta obligado a comprarlas todas.
De hecho no está obligado a comprar ninguna o las puede comprar todas si así lo desea.
Ustedes van a ser evaluados con tres metricas relacionadas con los 3 puntos arriba:
1) Que tan cerca están sus pronósticos de los verdaderos valores de totalpay en la hoja de
prueba.
2) su pronostico de cuanto se puede recuperar de cada una de las 3750 cuentas —> celdas
b2:b3751
3) una variable binaria (1 o 0) indicando qué cuentas usted desea comprar. El 1 indica que
usted la quiere comprar. El 0 indica que usted no desea comprarla —> celdas c2:c3751.
Asegúrense que en las celdas hay números y no formulas. Este trabajo es corregido por un
programa que automatiza la corrección de sus respuestas.