Está en la página 1de 16

Raquel Jorge Hernando

Taller Certificación CAP®


Preparación para la certificación CAP® (Certified Analytics Professional)

Sesión 1

OBSbusiness.school Partner académico:


Índice

INTRODUCCIÓN ........................................................................................................................................................ 3
CRISP-DM FASE 1: COMPRENSIÓN EMPRESARIAL ..................................................................................................... 4
DOMINIO I ESTRUCTURA DE PROBLEMAS DE NEGOCIO ............................................................................................................. 4
DOMINIO II. ESTRUCTURA DE LOS PROBLEMAS DE ANÁLISIS....................................................................................................... 5
CRISP-DM FASE 2 Y 3: COMPRENSIÓN Y PREPARACIÓN DE DATOS ........................................................................... 8
DOMINIO III DATOS .......................................................................................................................................................... 8
CRIPS-DM FASE 4: MODELADO ............................................................................................................................... 12
DOMINIO IV SELECCIÓN DE LA METODOLOGÍA (ENFOQUE) ..................................................................................................... 12
BIBLIOGRAFÍA ......................................................................................................................................................... 16

OBSbusiness.school Partner académico:


Introducción
¿Qué queremos decir exactamente cuando hablamos de analítica?

El uso popular del término es con frecuentemente combinado con otros términos usados como “Big Data”,
“Data Science”, “Machine Learning”, “Artificial Intelligence”, and “Cognitive Computing”. Robert Rose
identifica tres principales usos para el término “Analytics”:

1. Como sinónimo de métricas de resumen estadístico


2. Como sinónimo de “data science” (otro sobrecargado término)
3. Como termino genera que representa con un enfoque cuantitativo para la toma de decisión.

Cinco Principios
Los riesgos potenciales del uso de analytics varia ampliamente en función de la aplicación para la que se
use. Todo profesional de la analítica debe ser consciente de los problemas que ocurren y debe considerar
las consecuencias sociales en su trabajo, Diakopoulos y Friedler propusieron cinco principios que pueden
guiar la responsabilidad en la aplicación de la analítica:
1. Responsabilidad
2. Explicable
3. Precisión
4. Auditable
5. Equidad

Este taller explica los diferentes dominios y sus pesos en la certificación CAP® (Certified Analytics
Professional) y más abajo, Podemos encontrar la tabla sobre cada uno de ellos y los pesos que le
corresponden.

Dominio Pesos aproximados


I. Business Problem (Question) Framing 12%–18%
II. Analytics Problem Framing 14%–20%
III. Data 18%–26%
IV. Methodology (Approach) Selection 12%–18%
V. Model Building 13%–19%
VI. Deployment 7%–11%
VII. Model Life Cycle Management 4%–8%

Por otro lado, este talle muestra las similitudes entre la metodología CRISP-DM y JTA, como se muestra a
continuación:

CRISP-DM JTA
Domain 1 Business Problem Framing
Phase 1: Business Understanding
Domain 2 Analytics Problem Framing
Phase 2: Data Understanding
Domain 3 Data
Phase 3: Data Preparation
Domain 4 Methodology (Approach) Selection
Phase 4: Modelling
Domain 5 Model Building
Phase 5: Evaluation Domain 6 Deployment (T-1 and T-2)
Domain 6 Deployment
Phase 6: Deployment
Domain 7 Model Life Cycle Management

OBSbusiness.school Partner académico:


CRISP-DM Fase 1: Comprensión Empresarial
La primera fase de la metodología CRISP-DM es comprensión empresarial, y esta fase corresponde a los dos
primeros dominios de JTA: Encuadre de problemas de negocio y análisis de problemas. Ambos CRISP-DM y
JTA, reconocen la importancia que tiene los problemas frente a la comprensión empresarial y ponen
especial foco en como la analítica puede tener un impacto real y medible en una situación de negocio.

Dominio I Estructura de problemas de negocio


(La habilidad de entender los problemas de negocio y determinar si el problema es susceptible a una
solución analítica.)

El conjunto de estas tareas establece un excelente conjunto a seguir. Una vez completados estos pasos,
tendremos una declaración de problema empresarial claramente definido y documentado.

T-1 Obtener o recibir la declaración del problema y los requerimientos de usabilidad


Una declaración de problema empresarial generalmente empieza con la descripción de una oportunidad
de negocio o de los peligros o problemas que puedan surgir en términos generales.

Una manera popular de enmarcar una oportunidad o un problema de negocio es obtener información de
confianza sobre las cinco W:

• Who (Quiénes): son los stakeholders quien satisfacen una o más de las siguientes condiciones con
respecto al proyecto: financiamiento, uso, creación o afectados por el resultado del proyecto.
• What (Qué): problema o función está destinado a resolver o realizar el proyecto?
• Where (Dónde): ocurre el problema? ¿O dónde debe realizarse la función? ¿Están articuladas las
características físicas y espaciales?
• When (Cuándo): ocurre el problema o es necesario realizar una función? ¿Cuándo debe
completarse el proyecto?
• Why (Por qué): ocurre el problema o es necesario que se produzca la función?

T-2 Identificar los stakeholders


De las cinco preguntas clave, quiénes (las partes interesadas) son probablemente las más críticas para el
éxito a largo plazo del proyecto. Las partes interesadas son todas las personas afectadas por el proyecto,
no solo las que participaron en las reuniones iniciales, y pueden tener diferentes niveles de participación
durante el proyecto. Un análisis de las partes interesadas ayuda a identificar lo siguiente:

• Los intereses de todas los stakeholders que pueden verse afectadas por el proyecto, junto con sus
limitaciones.
• Problemas potenciales que podrían interrumpir el proyecto.
• Personas clave para la distribución de información durante la fase de ejecución.
• Grupos a los que se debe animar a participar en las diferentes etapas del proyecto.
• Planificación de la comunicación y estrategias de gestión de grupos de interés durante la fase de
planificación del proyecto.
• Formas de reducir los posibles impactos negativos y gestionar las partes interesadas negativas.

OBSbusiness.school Partner académico:


T-3 Determinar si el problema es apto para una solución analítica.
El profesional de la analítica comienza a comprender el problema, es importante comenzar a pensar sobre
si la analítica tiene sentido para este problema o para la situación empresarial. Dado que toda solución de
análisis requiere datos, este es el lugar donde el profesional de análisis comienza a determinar si hay datos
disponibles, si son de fácil acceso y si existen problemas relacionados con la obtención de los datos.

T-4 Refina el enunciado del problema y delimita las restricciones


Esta tarea es esencialmente un reconocimiento de que a medida que uno aprende más sobre el problema
empresarial; el enunciado del problema puede cambiar o hacerse más claro. Muchas personas que
participan en la declaración del problema lo ven como un documento orgánico, lo que significa que es un
documento que se desarrolla o crece con el tiempo a medida que los autores aprenden más sobre la
situación comercial. Veremos que el documento de enunciado del problema puede ser revisado muchas
veces, justificando aún más su consideración, desde el principio, como un documento orgánico.

T-5 Definir un conjunto inicial de beneficios de negocio


Con el conjunto de todo el problema, ahora es posible definir el conjunto inicial de beneficios de negocio.
Estos beneficios pueden determinarse cuantitativa o cualitativamente. Si es cuantitativo, puede ser
financiero (por ejemplo, valor actual neto) o contractual (por ejemplo, acuerdos de nivel de servicio). Esto
también se conoce como caso de negocio (business case).

Este es también un momento para que el profesional de análisis proceda con mucho cuidado. Los beneficios
de negocio planeados o esperados deben ser razonables, considerando todos los factores ya discutidos en
fases anteriores. Estos incluyen la disponibilidad y calidad de los datos requeridos para el proyecto, así
como el tiempo y los recursos que la organización tiene que dedicar al proyecto.

T-6 Obtener el acuerdo de los stakeholder en el planteamiento del problema


Con el planteamiento del problema refinado y los beneficios iniciales de negocio, es necesario obtener el
consentimiento de los stakeholder antes de seguir adelante con el proyecto. Puede ser necesario repetir
este ciclo varias veces hasta que los stakeholder estén de acuerdo con los detalles del proyecto y se otorgue
el permiso para continuar. Al final de este proceso, tendremos un acuerdo sobre los objetivos del proyecto,
el enfoque inicial y los recursos para llegar allí.

Dominio II. Estructura de los problemas de análisis


(La capacidad de reformular un problema empresarial en un problema de análisis con una posible solución
de análisis).

A continuación, vamos a ver información sobre el diálogo entre los empresarios que tienen un problema
que necesitan resolver y los analistas que les darán la información necesaria para resolver el problema. Este
diálogo está mediado por el profesional de análisis en quien ambas partes confían porque tiene el
conocimiento de cada lado. Al igual que con cualquier esfuerzo de traducción entre dos grupos diferentes,
gran parte de lo que sigue son preceptos simples para mantener el sentido del problema empresarial
mientras lo descompone en piezas analíticas procesables.

OBSbusiness.school Partner académico:


T-1 Reformular planteamiento del problema como un problema de análisis
Después de completar el Dominio I, tenemos un documento inicial planteamiento del problema de negocio.
Para el analista profesional, esto plantea la pregunta: ¿Cuál es el problema de análisis?

La redacción del documento de Estructura de los problemas de análisis no se puede completar sin
completar las tareas que incluyen lo siguiente:

• Pensar y enumerar, si es posible, los factores clave o conjuntos de relaciones en los datos que
permitirán que el modelo alcance una solución aceptable.
• Enumerar los supuestos que se necesitan en la actividad de modelado.
• Definición de métricas de éxito.
El primer paso es decodificar el enunciado del problema de negocio para llegar al problema de análisis. Hay
muchas formas de hacer esto, algunas más formales que otras. En términos simples, está traduciendo el
"qué" del problema empresarial en el "cómo" del problema analítico.

1. ¿Qué resultado queremos?


2. ¿Quién actuará?
3. ¿Qué harán?
4. ¿Qué cambiará en la organización como resultado de la nueva información generada?

El modelo más conocido en esta área es el modelo de requisitos de Kano (Figura 1). Distingue entre cambios
inesperados del cliente, requisitos conocidos del cliente y elementos imprescindibles del cliente que no se
declaran explícitamente.

Figura 1: Modelo de requisitos de Kano (utilizado en Creative Commons,


http://creativecommons.org/licenses/by-nc-nd/3.0/us/)

T-2 Desarrollar un conjunto propuesto de factores clave y las relaciones con los productos.
Esta tarea se centra en la estructura del modelo que proponemos para construir. Un aspecto fundamental
de todo modelado es la noción de organización lógica y presentación de las cosas que sabemos (las
entradas) que utiliza un modelo analítico para obtener las cosas que queremos saber y el final (las salidas).
Una gran parte del proceso de modelado es ordenar a través de todos los datos y descubrir los factores
clave y las relaciones importantes que van a ser explotados de manera que el modelo que construimos
producirá la salida requerida.

OBSbusiness.school Partner académico:


Un ejemplo simple: una organización desea predecir la cantidad de desperfectos de software detectados
durante los próximos seis meses. Esos son los outputs. Los inputs se obtendrían de las entrevistas con las
partes interesadas, utilizando preguntas como,” ¿Qué actividades futuras se sumará a la tarifa de donde
estamos hoy?", "¿Qué disminuirá nuestra tasa desde donde estamos hoy?", "¿Agregaremos interfaces o
componentes a la prueba?”, “¿Cambiaremos materialmente el tamaño del equipo de prueba?”, etc. Hay
que tener en cuenta que no está buscando la causalidad en esta etapa, solo ideas alrededor de las cuales
formará algunas hipótesis contra las cuales probarás tu modelo más tarde.

Una vez que tengamos los inputs y una idea general de los efectos previstos, se podrá elegir cómo
comunicarlos al equipo en general. Una tabla simple (Figura 2) es un enfoque de este proceso, donde se
muestra que la forma de desarrollarlo no es tan importante como el desarrollarlo de una manera que la
gente que está trabajando en ello lo entienda correctamente.

Stakeholders Inputs Procesos Outputs

•Identificación de •Requisitos •Identificación de •Producto final del


proveedores de •Recursos metricas y KPI's proceso
información requeridos por el
proceso

Figura 2: Tabla Input

Incluso estos simples ejemplos ayudan a ilustrar el concepto. La idea aquí es hacer visibles los inputs y
empezar a llegar a un acuerdo entre el equipo de dirección y la magnitud de las relaciones con el problema
y crear las hipótesis relacionadas que utilizará más adelante para atacar a los datos.

T-3 Indicar el conjunto de supuestos relacionados con el problema


Igual de relevante es pensar en la estructura del enfoque de modelado propuesto como aclarar a la
organización patrocinadora qué suposiciones se están haciendo. Los supuestos que se pueden pensar en
un contexto son principalmente técnicos o analíticos que afectan al modelado.

T-4 Definir métricas claves del éxito


Esta actividad está estrechamente relacionada con el Dominio I, Tarea 5, en el que definimos los beneficios
del negocio. En esta tarea, nos centramos en cómo la actividad de modelado puede mejorar la situación del
negocio. Las métricas clave de éxito emplearán el mismo conjunto de métricas desarrolladas en esa tarea
anterior, pero en este caso, se centrarán en cómo funciona el modelo o el conjunto de modelos que se
están considerando. Esto incluye cómo se medirán, notificarán e interpretarán las mejoras específicas que
se contemplan.

T-5 Obtener el acuerdo de los stakeholder


El objetivo de esta tarea final es presentar los interesados un documento escrito, junto con la posibilidad
de una presentación, para explicar el plan a todo el grupo y contestar aquellas preguntas que puedan surgir.
Este también es un momento apropiado para enfocarse de manera muy clara y decidida en la noción de
expectativas de los stakeholder.

OBSbusiness.school Partner académico:


CRISP-DM Fase 2 y 3: Comprensión y
preparación de datos
Los datos se han denominado el "aceite" que alimenta y lubrica el motor de análisis, por lo que tener éxito
en estas fases del proyecto es fundamental para el éxito.
La metodología CRISP-DM incluye dos fases separadas dedicadas a los datos, por el contrario, la JTA fusiona
todas las actividades asociadas con los datos en un solo dominio llamado Datos.

Dominio III Datos


(La capacidad de trabajar eficazmente con los datos para ayudar a identificar las posibles relaciones que
conduzcan al perfeccionamiento del problema de negocio y el análisis.)

Encontramos que el detalle en la JTA para el dominio de datos proporciona una comprensión más profunda
de las dos fases de CRISP-DM de comprensión y preparación de datos.

Antes de explorar los datos, será útil una revisión de los distintos tipos de datos. La Figura 3 muestra una
jerarquía útil para describir estos:

Data

Cualitativo Cuantitativo

Ordinal Nomial Discreto Continuo

Binario

Figura 3: Tipo de dato

La Figura 4 muestra el flujo de datos a través del proceso y las actividades importantes llevadas a cabo en
cada etapa:

Figura 4: Preparación del dato

OBSbusiness.school Partner académico:


El proceso analítico

Independientemente del área de especialización o interés de uno, es cierto que la mayoría de los
estudiantes y profesionales de la analítica dedican la mayor parte del esfuerzo y la energía que se dedica a
la formación al aprendizaje de métodos y algoritmos analíticos. Una revisión de un plan de estudios típico
de análisis de negocios pone de manifiesto un claro enfoque en las herramientas y técnicas necesarias, a
menudo en un contexto específico, como el marketing o las operaciones, para ser un análisis exitoso
practicante.

Por lo tanto, a menudo es una sorpresa para las personas que se inician en el campo descubrir que, en la
mayoría de los proyectos de análisis, la mayor parte del tiempo no se dedica a utilizar los algoritmos
recientemente dominados con tanto esfuerzo y determinación. Más bien, es mucho de un profesional de
la analítica pasar la mayor parte de su tiempo jugando con datos. Veremos a continuación una visión general
sobre algunos de los desafíos en la identificación, recopilación y preparación de datos para el análisis.

Figura 5: El proceso analítico m

T-1 Identificar y priorizar las necesidades y fuentes de datos


El énfasis del equipo de análisis, aquí, es aprender tanto como sea posible de la documentación
proporcionada por las partes interesadas, así como de entrevistas y talleres para asegurarse de que la
necesidad de datos sea clara y el nivel de comprensión de los datos sea alto. Esta es otra tarea que se centra
en las habilidades más suaves de comunicación, entrevistas, adquisición de información y comprensión
empresarial.

El resultado de esta tarea debe ser un plan con:

• establecer exactamente qué elementos de datos son necesarios


• de dónde vendrán
• en qué forma serán transferidos
• cuál es el plazo para realizar el proceso de transferencia de datos

OBSbusiness.school Partner académico:


T-2 Adquirir datos
Esta tarea es la implementación del plan. Para iniciar el plan, podemos optar por recopilar datos y luego
tomar la decisión en función de los resultados del ejercicio de recopilación de datos. Si elegimos recopilar
datos, nuestro árbol de decisiones se convierte en:

a. Continuar el curso actual i. Obtener un resultado promedio


1. Reunir datos y obtener
información favorable i. Obtener un resultado bueno
b. Implementar un cambio
ii. Obtener un mal resultado

a. Continuar el curso actual i. Obtener un resultado promedio


2. Reunir datos y obtener
información desfavorable i. Obtener un resultado bueno
b. Implementar un cambio
ii. Obtener un mal resultado

Una vez que identificamos las variables sobre las que se deben recopilar los datos, el siguiente paso es
recopilar esos datos. La recopilación de datos es equivalente a formular a ciertos sujetos determinadas
preguntas cerradas en determinadas circunstancias. Por lo tanto, hay cinco pasos involucrados en la
recopilación de datos:

1. Determinar cómo identificar a los sujetos (el diseño de la muestra)


2. Determinar cuántos sujetos identificar (el plan de muestreo)
3. Determinación de las preguntas que se harán
4. Determinar las posibles respuestas a la pregunta (la granularidad del experimento)
5. Determinación de un grupo de control

T-3 Armonizar, cambiar la escala, limpiar y compartir datos


En esta tarea vamos a trabajar para que los datos estén listos para usarse. Los diferentes tipos de problemas
que nos podemos encontrar en el proceso de armonización, cambio de escala y limpieza de datos son:

• Estructura de los datos: el primer paso en muchas tareas de armonización


de datos es crear una estructura de datos "normalizada".

• Datos faltantes: el analista debe asegurarse de comprender completamente cómo se prepararon


los datos y también debe formular un plan claro para manejar los datos faltantes.

• Fusionar datos: es típico que los datos provengan de varias fuentes


de datos diferentes y también es común que los valores para un
elemento de datos en particular difieran entre esas fuentes.

OBSbusiness.school Partner académico:


Los datos se cargan entonces en la base de datos común. Por lo general, la información se normaliza de
modo que cualquier elemento de información solo aparezca en la base de datos exactamente una vez. Este
es el lugar para realizar algunas comprobaciones finales de la calidad de los datos:

8.
1. 2. 3. 4. 5. 6. 7. 9. 10.
Formato
Integridad Corrección Coherencia Actualidad Colaborativo Confidencial Claridad Conveniente Rentable
común

¿Los datos
¿Los datos ¿Se
¿Están proporcio ¿Son los ¿El coste
¿Los datos ¿Los datos están en acceder a
completos ¿Son los nados son ¿Están los datos es
están se basan un los datos
todos los datos coherente datos a legibles y proporcio
obsoletos en un formato de forma
campos de precisos? s con la salvo? comprensi nal a su
? consenso? de fácil cómoda y
los datos? definición bles? valor?
uso? rápida?
?

T-4 Identificar relaciones en los datos


Existen infinidad de formas de comprender los datos, y estás se pueden organizar en nueve pasos. La
siguiente lista de The Field Guide to Data Science de Booz-Allen-Hamilton describe algunas de las técnicas
que pueden ser útiles para implementar cada uno de estos pasos:

1. Filtrado
2. Completar los datos faltantes
3. Reducir el número de dimensiones en los datos
4. Extracción de características
5. Recopilación y resumen de datos
6. Agregar nueva información a los datos
7. Segmentar los datos para encontrar agrupaciones naturales
8. Determinar qué variables son importantes
9. Clasificación de datos en grupos existentes

T-5 Documentar e informar los hallazgos (por ejemplo, conocimientos, resultados, desempeño
comercial)
El trabajo de datos que se ha descrito, la adquisición, la limpieza y la exploración de datos representan una
gran cantidad de trabajo, y es una buena práctica anotar todo lo que ocurrió al realizar esas tareas y
comunicar esos hallazgos a la comunidad de las partes interesadas.

T-6 Refinar los problemas de negocio y análisis


Los datos se adquieren, se limpian y se comprenden mucho mejor. Esta fase consiste en modificar los
documentos de declaración de problemas de análisis y negocios con la información, los planes y las ideas
de actualización. El objetivo de esa actividad es buscar una aprobación de actualización y / o un acuerdo
para avanzar desde la estructura organizacional adecuada que monitorea el proyecto de análisis.

OBSbusiness.school Partner académico:


CRIPS-DM Fase 4: Modelado
Con el conocimiento del negocio y el análisis de los posibles problemas, con lo que se ha desarrollado
previamente y con lo que se ha llegado a comprender, junto a los datos que hemos adquirido y preparado
para su uso, se podrá crear una solución que compense las necesidades de la organización, mejore el
negocio, el rendimiento y resulte ser sostenible durante la vida útil esperada de la aplicación.

Dominio IV Selección de la metodología (enfoque)


(La capacidad de identificar y seleccionar los enfoques potenciales para resolver el problema de negocio.)

T-1 Identificar los enfoques (métodos) de resolución de problemas disponibles


Casi todos los modelos analíticos se pueden clasificar en una de estas tres categorías:

Figura 7: INFORMS CAP® Metodologías de Clasificación

Metodologías prescriptivas
Un modelo prescriptivo ofrece soluciones que brindan respuestas cuantificables específicas que se pueden
implementar para resolver un problema. Por ejemplo, un modelo de programación lineal.

Un modelo prescriptivo responde a la pregunta "¿Cuál es la mejor acción o resultado?". El factor clave aquí
es proporcionar nuevas formas de mejorar ciertos tipos de desempeño. Algunas técnicas prescriptivas son:

Linear programming
Integer programming
Nonlinear programming
Optimization Mixed integer programming
Network optimization
Dynamic programming
Metaheuristics

Simulation-Optimization

Stochastic Optimization

OBSbusiness.school Partner académico:


Metodologías Predictivas
Las metodologías predictivas incluyen cualquier modelo de pronóstico, como modelos de series de
tiempo, por ejemplo, promedios móviles, modelos de autoregresión, etc. Estos modelos principalmente
hacen un pronóstico para el futuro para responder a la pregunta "¿Qué podría suceder?". El factor clave
aquí es predecir las tendencias y posibilidades futuras. Algunos ejemplos de técnicas predictivas son:

Clustering
Discrete event

Simulation Monte Carlo Classification Artificial Intelligence (AI)

Agent-based modeling
Game Theory

Confidence intervals Logistic

Hypothesis testing
Statistical Regression Linear
Inferences
Analysis of variance
Step-wise
Design of experiments

Metodologías Descriptivas
Las metodologías descriptivas son una colección de modelos que ayudan a describir la situación del
problema para su posterior análisis. Se transmiten a través de histogramas, diagramas de dispersión, etc.,
presentaciones numéricas como media, mediana, moda, varianza, desviaciones estándar. Responden a la
pregunta "¿Qué pasó?". El factor clave aquí es el uso de datos históricos. Lustig et al. propuso una
clasificación de la analítica descriptiva en tres áreas:
Informes y paneles estándar
Analítica Descriptiva Presentación de informes ad hoc
Análisis / consulta / desglose

T-2 Seleccionar herramientas de software


Un punto clave para el CAP es que un buen analista tendrá una caja de herramientas con varias
herramientas diferentes. Aquí están las categorías de software desde un punto de vista analítico:

Spreadsheet Statistical Data


systems systems integration
systems

Data Structured data


Optimization Simulation management
as HADOOP systems systems Unstructured data
systems

Existen innumerables metodologías entre las que un modelador puede elegir para resolver un problema. A
continuación, se muestran algunos tipos de metodologías de análisis que se utilizan comúnmente:

OBSbusiness.school Partner académico:


Often used to understand bottleneck(s) in systems
Discrete event Handles cases that cannot be handled by queuing
simulation theory
Often used for multistage processes modeling
Designed to identify the most efficient pathway to
Queuing model solution
Queuing modeling is not needed
Monte Carlo
simulation Used primarily to estimate dependent variable randomness out of a set of independent variable
randomness.

Agent-based A system modeled (simulated) as a collection of autonomous decision-making entities called agents
modeling (ABM) that are used to discover emergent behavior that is hard to predict without simulating it.
System dynamics
A simulation approach used to understanding the interactions of a complex system over time.
(SD)
Game theory Study of strategic decision-making processes through competition and collaboration.

The likelihood of a particular event occurring expressed as a percentage to make decisions under
Probabilities chosen risk or tolerance. Bayesian and conditional probabilities are widely used in analytics.
IRR (internal rate of return)–discounted rate used in
capital budgeting to compare returns on investment
opportunities
NPV (net present value)–difference between present
value of incomeversus outgo
Evaluation often used to guide the optimal FV (future value)–value of a future event or item based
Economic analysis allocation of scarce resources: on current value that is adjusted by some standard
amount, i.e., expected inflation

Payback period–period of time after which an


expenditure is fully amortized and income begins to
accrue in excess of expenses

Linear regression–compares the relationship between a


dependent variable and one or more explanatory
variables.
A class of statistical methodologies used to
map dependent variables with independent Stepwise regression–method of model building that
Regression variables and understand the significance successivel adds or deletes variables based on
between the variables and their correlations performance.
Design of with one another.
experiments Logistic regression–may also be called logit analysis, is a
regression analysis often used to predict the outcome
Confidence intervals of categorical variables.
Statistical inferences
Hypothesis testing
Analysis of variance
(ANOVA)
Principal component
Can be used to reduce data dimensionality.
analysis (PCA)
Data mining

Forecasting
Artificial neural networks
Artificial intelligence Fuzzy logic
Expert systems
Decision trees Linear programming
Integer programming
Mixed integer programming
Combinatorial optimization
Optimization Nonlinear programming
Constraint programming
Markov chain Response surface methodology (RSM)
Metaheuristics
Revenue
management (yield Greedy heuristics
management)

OBSbusiness.school Partner académico:


T-3 Estrategia de prueba (métodos)
Los modelos desarrollados deben ser verificados y validados. El paso de verificación se refiere a asegurarse
de que el modelo esté construido de la manera en que fue diseñado y destinado a ser. El paso de validación
se refiere a asegurarse de que el modelo represente la vida real con un cierto nivel de precisión. Si el
modelador se da cuenta de que la validación y la verificación son inalcanzables, entonces el modelador
debe considerar otros enfoques.

Para ayudar en el proceso de prueba, es recomendable dividir los datos en tres partes:
• Construcción: es la parte de los datos que se utiliza para estimar los parámetros necesarios, como
pendientes, en caso de regresión.
• Prueba: es la parte de los datos que se usa para probar el modelo y verificar que se ha modelado
como fue diseñado.
• Validación: es la parte de los datos que se usa para probar que el modelo se comporta de manera
cercana al comportamiento que ha sido modelando.

T-4 Seleccionar la estrategia (métodos)


En analítica, un proyecto tiene tres formas, que no siempre tienen que ser equivalentes:
• Exploratorio: la analítica necesita crear visualizaciones rápidas para respaldar su proceso de
exploración y descubrimiento. Las visualizaciones pueden ayudar a desarrollar la intuición y dar
nuevas ideas, pero no son necesariamente de calidad de publicación o presentación.
• Presentación: la analítica necesita crear visualizaciones como parte de las ideas de una
presentación, los pasos del método y los resultados para los patrocinadores, las partes interesadas
y los usuarios.
• Publicación: la analítica quiere crear figuras o animaciones que serán publicadas o publicadas y
deben ser de calidad adecuada para fines de archivo.

OBSbusiness.school Partner académico:


Bibliografía
Cochran, E. b. (2019). Informs Analytics body of Knowledge. John Willey & Sons, Inc .

Taber, A., Samaddar, S., Bordley, R., Musa, R., Smith, M., Stein, F., Truxillo, C., Waltz, Z. (2014).
INFORMSCERTIFIED ANALYTICS PROFESSIONAL (CAP®). Examination Study Guide. Informs.

OBSbusiness.school Partner académico:

También podría gustarte