Está en la página 1de 1

Instrucciones para el Trabajo sobre Select Collections

Los datos para este trabajo son dos hojas CSV llamadas selectcollections1.csv y
selectcollections2.csv.

Este es un trabajo "individual" (aunque su nota se determinara por el rendimiento promedio de


su grupo). Quiero que suban aqui un archivo de Excel--yo se los proveere-- (formato XLSX).

Quiero que nombren este archivo con su numero de estudiante; por ejemplo 123456789.xlsx
(substituyendo 123456789 con su numero de estudiante de INCAE). No quiero nada mas que
esos 9 numeros. El que ignore esta instruccion le pondré 0 de calificacion. No me reclamen
despues.

En este trabajo va a hacer tres cosas para mi:

1) Van a pronosticar cuanto puede cobrarse o recuperarse de cada cuenta en la base de datos
nueva.

2) Van a seleccionar que cuentas comprar de todas las contenidas en ese archivo.

3) Van, basados en las metricas de R-cuadrado y RMSE, a “pronosticar” que tan util creen
ustedes que seria su mejor modelo para ayudar a la empresa a hacer mejor su negocio.

Usted puede comprar cuantas cuentas usted desee por $850 cada una. Este valor es el
promedio de totalpay en la base de datos nueva. Usted no esta obligado a comprarlas todas.
De hecho no está obligado a comprar ninguna o las puede comprar todas si así lo desea.

Ustedes van a ser evaluados con tres metricas relacionadas con los 3 puntos arriba:

1) Que tan cerca están sus pronósticos de los verdaderos valores de totalpay en la hoja de
prueba.

2) Mas importante: Cuanta utilidad producen para la empresa SelectCollectionsInc.

3) Que tan razonable es su argumento para la parte 3.

En la hoja de Excel provista en la pagina del curso quiero 3 columnas:

1) el identificador (id) —> celdas a2:a3751

2) su pronostico de cuanto se puede recuperar de cada una de las 3750 cuentas —> celdas
b2:b3751

3) una variable binaria (1 o 0) indicando qué cuentas usted desea comprar. El 1 indica que
usted la quiere comprar. El 0 indica que usted no desea comprarla —> celdas c2:c3751.

En las celdas E2 y E3 quiero los R-cuadrados y RMSE para su mejor modelo.

Asegúrense que en las celdas hay números y no formulas. Este trabajo es corregido por un
programa que automatiza la corrección de sus respuestas.

La respuesta a la pregunta 3 la subiran en un archivo PDF nombrado de la misma forma que el


XLSX.

También podría gustarte