Está en la página 1de 4

Tarea: Inteligencia artificial.

Orange Data mining

Victor Beniz, Fabiola Ramirez

Cargue los datos BANK MARKETING (datasets)

1. Investigue qué representa cada una de las veinte variables del conjunto de datos. Explique
detalladamente.

1 – age: edad (numérico)


2 - job: tipo de trabajo (categórico: "administrativo", "obrero", "empresario", "empleado
doméstico", "directivo", "jubilado", "autónomo", "servicios", "estudiante", "técnico",
"desempleado", "desconocido")
3 - marital: estado civil (categórico: "divorciado", "casado", "soltero", "desconocido"; nota:
"divorciado" significa divorciado o viudo)
4 – education: educación, (categórica: "básica.4 años", "básica.6 años", "básica.9 años",
"bachillerato", "analfabeto", "curso profesional", "título universitario", "desconocido")
5 -default:¿tiene un crédito en mora? (categórico: 'no','sí','desconocido')
6 - housing:¿tiene préstamo para la vivienda? (categórico: "no", "sí", "desconocido")
7 – Loan: préstamo, ¿tiene un préstamo personal? (categórico: "no", "sí", "desconocido")
# relacionado con el último contacto de la campaña actual:
8 – Contact: contacto tipo de comunicación del contacto (categórico: 'celular','teléfono')
9 – Month: mes del año del último contacto (categórico: 'ene', 'feb', 'mar', ..., 'nov', 'dec')
10 - day_of_week: día de la semana del último contacto (categórico:
'mon','tue','wed','thu','fri')
11 - duration: duración del último contacto, en segundos (numérico). Nota importante:
este atributo afecta en gran medida al objetivo de salida (por ejemplo, si la duración=0
entonces y='no'). Sin embargo, la duración no se conoce antes de realizar una llamada.
Además, después de la finalización de la llamada y es obviamente conocido. Por lo tanto,
esta entrada sólo debería incluirse a efectos de evaluación comparativa y debería
descartarse si la intención es tener un modelo predictivo realista.
# Otros atributos:
12 – Campaign: número de contactos realizados durante esta campaña y para este cliente
(numérico, incluye el último contacto)
13 - pdays: número de días transcurridos desde que se contactó por última vez con el
cliente en una campaña anterior (numérico; 999 significa que no se contactó con el cliente
previamente)
14 - Previous: número de contactos realizados antes de esta campaña y para este cliente
(numérico)
15 - poutcome: resultado de la campaña de marketing anterior (categórico: "fracaso",
"inexistente", "éxito")
# atributos del contexto social y económico
16 - emp.var.rate: tasa de variación del empleo - indicador trimestral (numérico)
17 - cons.price.idx: índice de precios al consumo - indicador mensual (numérico)
18 - cons.conf.idx: índice de confianza del consumidor - indicador mensual (numérico)
19 - euribor3m: índice euribor a 3 meses - indicador diario (numérico)
20 - nr.employed: número de empleados - indicador trimestral (numérico)

2. Analice los datos usando un árbol de decisión.

Las características mostradas, mediante el árbol de datos, nos muestran cuales son
las consideraciones de los clientes al momento de elegir un banco para solicitar un
depósito a plazo fijo. En este caso la información fue adquirida tomando como referencia
las campañas de marketing, mediante llamadas telefónicas, de una institución bancaria
portuguesa. Dicha Campania consta de más de 40000 llamadas, pero el data set concreto,
que se uso en el software Orange, genera aproximadamente 4000 iteraciones de estos
ejemplos de forma aleatoria. La imagen a continuación muestra los primeros 4 niveles del
árbol generado.

3. ¿Qué determina que un cliente acceda a un depósito en plazo fijo? Explique


detalladamente.

La característica más relevante, según el árbol de datos generado, es el número de


empleados que posee el banco. Esta característica desde la perspectiva del cliente es
sumamente relevante por el hecho de que un banco, con mayor prestigio y grado de
confiabilidad, debería tener un gran número de empleados. Observando la imagen
anterior se observa que solo un 10.9% llevo a cabo un deposito a plazo y en los casos
donde el numero de empleados de la entidad bancaria era inferior o igual a 5076
empleados, los clientes tuvieron una notoria preferencia (43%, 226 de 519). Esto muy
probablemente se deba a la confianza que tiene la población en bancos “locales” y no muy
grandes, ya que por el contrario, los bancos que cuentan con más de 5076 empleados solo
tuvieron un 6.2% de aceptación del deposito a plazo fijo.
4. Retire los atributos de contexto ¿Qué determina que un cliente acceda a un depósito en
plazo fijo? ¿Qué tan importante es para los clientes del banco la situación económica de
Portugal? Explique detalladamente.

Cuando se ignoran los atributos del contexto social y económico, la característica


mas importante es la duración del último contacto telefónico. En el caso de efectuar el
deposito a plazo se tiene la siguiente imagen donde la característica mas importante para
decidir si llevar a cabo el deposito a plazo es la duración del último contacto telefónico.

Donde se puede observar que si la duración es menor o igual a 402 segundos la


segunda característica mas relevante es el resultado de la campaña anterior, si esta fue
exitosa se nos muestra que el porcentaje de interesados en hacer un deposito en dicho
banco es considerable (58% de los 109 clientes que se decantaron por este atributo). Por
otro lado, si la llamada supera los 402 segundos vemos que la característica relevante
sigue siendo la duración del contacto telefónico, si esta es inferior a 681 segundos el
cliente se decanta por el atributo de resultado de campaña anterior. De ser esta mayor a
681 segundos el trabajo del cliente es lo que determina si acepta hacer el depósito o no,
para este caso se observa que el 66% de los clientes que se decantan por este atributo y
aceptaron hacer el depósito son; administrativos, obreros, desempleados y de oficio
desconocido, quiere decir que la mayoría de las personas que tienen estos oficios acepto
depositar a plazo fijo en el banco. En cambio, para quienes son empresarios, empleados
domésticos, directivos, autónomo, jubilados, estudiantes o técnicos se tuvo un porcentaje
de 45% de aceptación del depósito a plazo. Como se observa en la siguiente imagen.
5. Retire los atributos de contexto y el atributo duración del último contacto telefónico ¿Se
podría afirmar que el banco creo fidelidad entre sus clientes? Explique detalladamente.

Pese a que solo el 10.9% de los clientes acepto llevar a cabo el deposito a plazo, se
nos muestra que dentro de ese porcentaje el 68% de las personas, en los casos donde la
campaña anterior tuvo éxito, accedió a hacer el deposito a plazo, lo cual es una clara
muestra de que el éxito de la campaña anterior es un gran incentivo de cara al cliente y
crea nexos de confianza.

6. ¿Quiénes son los clientes que más accedieron a tomar un depósito a plazo fijo según la
educación de los mismos? Explique detalladamente. En cada uno de los puntos muestre el
árbol de decisión que le permite responden las preguntas.

De acuerdo con la imagen a continuación se muestra que, cuando la campaña


anterior tuvo éxito, la característica que condiciona la decisión de hacer un depósito a
plazo es el trabajo del cliente. En este punto se aprecia que los clientes como empleados
domésticos, de servicios y desempleados son quienes en un 94% acceden a hacer un
depósito a plazo. De estos últimos el 50% (1 de 2) de las personas que solo llegaron a
cuarto año de educación básica efectuaron el depósito, en cambio el 100% (16 de 16) de
las personas que alcanzaron una educación mayor llevaron a cabo el depósito a plazo fijo.

También podría gustarte