Está en la página 1de 60

SG SOFTWARE GURU

FUNDAMENTOS
ENTENDIENDO
MAPREDUCE
PAG. 50

REPORTAJE

INDUSTRIA DE
S O F T WA R E
EN
PAG. 12
COLOMBIA
NO.50 CONOCIMIENTO EN PRÁCTICA
www.sg.com.mx

APACHE SPARK
STREAMING
PAG. 18

USER EXPERIENCE
DESIGN
PAG. 34

PRUEBA DE SOFTWARE
PAG. 40

LA EMPRESA
DIRIGIDA
POR DATOS
50 | MARZO 2016
10a. edición

27 de abril 2016

Mayores informes
eventos@sg.com.mx
Tel: +52(55) 5239-5502

SG.COM.MX 001
NO.50 CONOCIMIENTO EN PRÁCTICA
www.sg.com.mx

EN PORTADA

LA EMPRESA DIRIGIDA
POR DATOS
020

¿Cómo es que las empresas pueden obtener


ventajas competitivas por medio de la analí-
tica de datos?

002 SG.50
CONTENIDO
O

I INDUSTRIA
Y EMPRESAS
P PRÁCTICAS
C COLUMNAS
O EN CADA
NÚMERO

Los Emprendedores de 008 Resolviendo Dilemas Tejiendo Nuestra Red 006 Noticias y eventos 005
TIC en México en un Pipeline de 030
Data Science Tendencias en 017 Hardware 052
Software
Cómo Iniciar Tu Carrera 034 Humor 053
en UX Design Prueba de Software
T HERRAMIENTAS Y
TECNOLOGÍAS
040
Biblioteca 056
¿Sigue Siendo 036 Programar es un 042
Radar 016 Importante el Modo de Vida
Aseguramiento de
Panorama 018 Calidad? Clave Morsa 044

Resistencia al Cambio 038


y Enfoque en el Cliente
V VOCES
R REPORTAJE

En Defensa
del Software
048 F FUNDAMENTOS Industria de Software
en Colombia
012

El Software Orientado 049 Entendiendo 050 Retrospectiva 054


al Consumidor MapReduce

INDUSTRIA DE SOFTWARE EN COLOMBIA


012

SG.COM.MX 003
O EDITORIAL

Viejos
los cerros

... y todavía reverdecen. El tema principal de este número es la analítica predictiva de


datos. Es una tendencia que está impactando todo tipo de nego-
Cincuenta números se dicen fácil, pero han involucrado más de 10 cios y es clave que conozcamos sus bases y las oportunidades
años y más de mil artículos. que representa.

Todo esto ha sido posible gracias a los cientos de colaborado- Al igual que los 49 números anteriores de SG (50 si contamos
res que han escrito en SG. Agradecemos a todas y cada una de el 0), este ha sido preparado con gran cariño y dedicación.
las personas que a lo largo de los años han dedicado tiempo a Esperamos que lo disfrutes y te sea útil.
compartir conocimiento con sus colegas por medio de nues-
tras páginas. En especial estamos muy agradecidos con nues-
tros columnistas, quienes en cada número nos inspiran a seguir
aprendiendo y aplicando. El equipo de Software Guru

SG es posible gracias a la colaboración de


Dirección Editorial Pedro Galván | Dirección de Operaciones Mara Ruvalcaba | Dirección Comercial Claudia Perea
Coordinación Editorial Susana Tamayo | Arte y Diseño Oscar Sámano | Suscripciones Mariana Torres
Consejo Editorial: Luis Daniel Soto | Gunnar Wolf | Luis Vinicio León | Hanna Oktaba
Ariel Jatuff | Emilio Osorio | Gloria Quintanilla | Jorge Valdés

COLABORADORES EN ESTA EDICIÓN


Alejandra Jiménez, Manuel del Pino, Jorge Gálvez, Miguel Nhuch, Blanca Vargas, Andrés Arteaga, Eduardo Flores,
Misael León, Roselyn Piñango, Masa Maeda, Manuel López Michelone.
.
EQUIPO SG
Coordinación de servicio Yoloxochitl Juárez | Marketing y Vinculación Wendy Fabela
Developer Relations Luis Sánchez e Hilda Ramírez | SG Campus Ariel García
Contacto: info@sg.com.mx

SG Software Guru es una publicación trimestral editada por Brainworx, S.A. de C.V., San Francisco 238 Altos. Col. Del Valle. Los contenidos de esta publicación son propiedad intelectual de los autores y se hacen
disponibles bajo licencia Creative Commons Attribution-NonCommercial 4.0 International. Todos los artículos son responsabilidad de sus propios autores y no necesariamente reflejan el punto de vista de la editorial.
Reserva de Derechos al Uso Exclusivo: En trámite. ISSN: 1870-0888. Registro Postal: PP15-5106. Distribuido por Sepomex.

004 SG.50
NOTICIAS
O

Noticias

CTO FORUM
1 FINNOSUMMIT BOGOTÁ 2016
2

Software Guru realizó una re- La capital de Colombia fue sede de Finnosummit,
unión más de su comunidad el evento de referencia para el sector de tecnolo-
de CTOs con el objetivo de gía financiera en Sudamérica. El evento brindó la
conocer tendencias, compar- oportunidad de analizar los avances tecnológicos
tir ideas y hacer networking. más disruptivos en torno a la industria financiera
La reunión se llevó a cabo en y al mismo tiempo. Además se complementó
el recién inaugurado Centro de Innovación BBVA en Ciudad de México. El tema con FINNOSUMMIT Challenge competencia
que dominó la agenda del día fue la gestión de datos, con ejecutivos de Tableau regional que eligió a las dos startups Fintech
compartiendo su visión sobre las 10 tendencias para 2016 en inteligencia de más prometedoras de Sudamérica, resultando
datos, y Delphix presentando una propuesta para habilitar datos en aplicativos ganadoras: Aflore una red de consejeros infor-
por medio de Data as a Service. Mantente al tanto de la próxima reunión en males que distribuyen productos financieros a
http://meetup.com/ctos-mx través de una plataforma tecnológica­y Alegra
­una aplicación en la nube que permite a peque-
ñas empresas gestionar sus gastos y facturas
desde cualquier lugar­.

HACKMTY
3

HackMty se realizó el 20 y 21 de febrero en las instalaciones del


Tecnológico de Monterrey Campus Monterrey con la participa-
ción de 400 hackers y el apoyo de empresas como Intel Software,
Icalia Labs, Segundamano, y Cemex entre otras. En su segundo
año, HackMty se ha convertido en el hackathon estudiantil más
grande en México, atrayendo estudiantes de todo el país e in-
cluso a algunos internacionales. Conoce la lista de ganadores en
http://hackmty.com

MICROSOFT CLOUD ROADSHOW EN MÉXICO


5

Sao Paulo y Ciudad de México fueron las ciudades en Latinoamérica elegidas para
TSP SYMPOSIUM MÉXICO
2016
4 unirse al Microsoft Cloud Roadshow, un evento itinerante realizado en 15 distintas
ciudades del mundo. La empresa aprovechó el evento para difundir ante la comuni-
dad tecnológica la variedad de su oferta de servicios en la nube, así como refrendar
su compromiso de empoderar a personas y organizaciones a hacer más a través
El 23 y 24 de febrero se llevó a cabo el TSP de su nube inteligente. Brad Anderson, Vicepresidente corporativo de Enterprise
Symposium México 2016, organizado por el Client and Mobility co-
Software Engineering Institute y el SIE Center mentó que las empresas en
de México, con apoyo de la Secretaría de México están acelerando
Economía a través de su fondo ProSoft 3.0. rápidamente su adopción
En él se dieron cita más de 270 personas para de la nube y que estiman
escuchar keynotes, participar en talleres y ac- que para 2018 el 90% de
tualizarse en temas importantes para la indus- las organizaciones mexi-
tria como la calidad de software, seguridad y canas utilicen al menos
arquitectura de software, TSP SM y nuevas una solución hospedada en
tecnologías e innovación y nuevos negocios. Microsoft Azure.

SG.COM.MX 005
C TEJIENDO NUESTRA RED

Propósito 2016: Organicémonos un Poco Más


Por Hanna Oktaba

Les quiero comentar sobre algunas iniciativas de orga- Investigación y Desarrollo en Computación (REMIDEC)
nización de la comunidad de la Computación y, en par- fundada en 2008 para hacer un análisis de la computa-
ticular, de Ingeniería de Software en las cuales me tocó ción desde su introducción a México, su estado actual y
participar como miembro fundador en los últimos años. sus perspectivas, en el marco de la conmemoración de
los 50 años de la computación en México. El Consejo
RED UNIVERSITARIA DE COLABORACIÓN DE de REMIDEC, integrado por los doctores Luis A. Pineda
INGENIERÍA DE SOFTWARE Y BASE DE DATOS (IIMAS UNAM), Christian Lemaitre (UAM Cuajimalpa),
La Dra. Hanna Oktaba es (REDIS&BD) Carlos Coello (CINVESTAV), Enrique Sucar (INAOE),
profesora de la UNAM y En mayo del 2006 se constituyó en la UNAM la Jesús Favela (CICESE) y Francisco Cantú (ITESM), plan-
su objetivo principal es Red Universitaria de Colaboración en Ingeniería de teó la posibilidad de crear la Academia Mexicana de
generar conocimiento a Software y Base de Datos (RedIs&BD), coordinada Computación como una Asociación Civil. La constitu-
través de la creación y por Guadalupe Ibargüengoitia González de la Facultad ción formal de la Academia Mexicana de Computación
promoción de estándares. de Ciencias. Su misión es integrar a un grupo de uni- AC sucedió el 9 de enero de 2015 con 19 miembros fun-
@hannaoktaba versitarios expertos para conformar una red de co- dadores (entre ellos su servidora como la única mujer).
laboración, intercambio y difusión del desarrollo y El objetivo principal de la Amexcomp es integrar a los
aplicación de software de calidad, para beneficio de investigadores, ingenieros, tecnólogos, innovadores, do-
la Institución. Durante 10 años la actividad de la red centes y promotores de la computación más distingui-
se ha concentrado en la organización de seminarios dos de México en las distintas áreas de la computación
mensuales y talleres, así como encuentros universi- para constituir un foro de excelencia de pensamiento
tarios; el último organizado en octubre de 2015, logró computacional que sirva como referencia central de la
conjuntar interesados no solo de la UNAM sino de ciencia y la tecnología computacional en México. En su
otras instituciones académicas y privadas. Más infor- primera asamblea general en diciembre de 2015 se crea-
mación en http://www.redisybd.unam.mx ron las secciones académicas por áreas de computación.
Una de ellas es la de Ingeniería de Software de la cual soy
RED TEMÁTICA MEXICANA DE LA INGENIERÍA coordinadora. Más información en http://amexcomp.mx
DE SOFTWARE (REDMIS)
Es un proyecto surgido de la Convocatoria de Registro y Como pueden ver hay un interés de la comunidad para
Estructuración de Redes Temáticas CONACYT 2014. Su organizarse con diferentes objetivos y alcances. Los
objetivo es integrar una red de especialistas en Ingeniería lectores de esta columna están cordialmente invitados
de Software, agrupando a los investigadores y académi- a unirse a ellas. Sin embargo, me parece que nos hace
cos así como a los empresarios con intereses comunes en falta mucho esfuerzo de lograr la cohesión y colabora-
la disciplina, con el fin de generar conocimiento científico, ción para que la sociedad, la industria y el gobierno nos
generar buenas prácticas de manera colegiada, elabo- conozcan, aprecien y aprovechen. Tenemos que hacer
rar y ejecutar propuestas que apoyen la educación en el más “ruido”. SG es uno de los pocos ejemplos en este
área, así como unir esfuerzos con la industria para apo- sentido, que hay que apoyar y seguir.
yar su competitividad en el ramo del desarrollo de soft-
ware. El responsable técnico de REDMIS es Reyes Juárez Al principio de 2016 lancé por twitter una llamada “Que
Ramírez de la Universidad Autónoma de Baja California y hagamos algo sensato para la industria de software en
en su Consejo Técnico se encuentran académicos de la 2016! ¿Qué se les ocurre?”. Recibí una sola propuesta
UNAM, UPSLP, UAM-I, UTM, ITH, UADY y UV. La co- pero, en mi opinión muy buena, “Concretar la constitu-
munidad está organizada por nodos ubicados en diversos ción de una comunidad de profesionales que fomente la
lugares del territorio mexicano. La principal actividad de la generación de ideas aplicables a la realidad mexicana”
REDMIS es dar continuidad a las reuniones académicas de Alexandra Alatorre (@alex_alatorre). Sobre todo me
de Ingeniería de Software realizadas desde el año 1997. gustó lo de “ideas aplicables a la realidad mexicana”.
La próxima es la reunión de CONISOFT16 que se llevará Creo que tenemos una fuente inagotable de oportunida-
a cabo en abril en la UPAEP, Puebla (http://redmis2016. des de innovación en serio, a través de la solución con
com.mx). Más información en http://redmis.com.mx TI de los problemas que padecemos. Pero la mayoría
sueña con competir con Facebook o exportar a E.U.
ACADEMIA MEXICANA DE COMPUTACIÓN
(AMEXCOMP) Para la discusión constructiva y propuestas los invito
Tiene como antecedente directo a la Red Mexicana de a @hanna.oktaba.

006 SG.50
TEJIENDO NUESTRA RED
C

SG.COM.MX 007
I EMPRENDIMIENTO

Los Emprendedores de TIC en México


El emprendimiento en las tecnologías de la información es proviene del sector privado, en otros países como Corea del Sur,
quizá el aspecto más disruptivo del mundo en las últimas déca- ésta representa 80%. La mayor parte del dinero en I+D es público
das. Hoy las nuevas empresas de tecnologías de la información y se concentra principalmente en la investigación académica con
están acaparando la atención por su alto crecimiento. Son las úni- un monto 2.5 veces mayor al de la investigación tecnológica. Por
cas, a lo largo de la historia bursátil, que en menos de 5 años han si fuera poco, prácticamente no hay vínculos institucionales entre
adquirido un valor mayor al del total de empresas que cotizan en el sector académico y la industria; en otras palabras las empresas
las bolsas de distintas economías. Tal es el caso de Whatsapp que no recurren a la academia para innovar, lo que impacta de manera
se vendió por 19 mil millones de dólares con apenas 52 empleados negativa. Un estudio reciente encontró que tan solo el profeso-
y con menos de 5 años de antigüedad. Este dinamismo explica rado y los estudiantes de la Universidad de Stanford habían creado
por qué la inversión de capital en Estados Unidos en los últimos 40,000 empresas y generado 5.4 millones de empleos desde 1930.
veinte años creció 5 veces más rápido en el sector TIC que en el Pero más importante es que dichas empresas generaron un valor
resto de la economía. agregado de 2.7 trillones de dólares, es decir mayor al tamaño de
la economía mexicana. De acuerdo al Reporte Financiero de la
Es así que en 2014, el Instituto Mexicano para la Competitividad Universidad de Stanford de 1995, el gobierno federal representaba
(IMCO) con el apoyo de Microsoft, realizó un estudio para cono- 40% del financiamiento para la institución en la materia.
cer las principales barreras y recomendaciones para impulsar el
ecosistema de emprendimiento de TI en México. Para ello entre- Otra forma de verlo, es a través de la brecha en ingresos que se
vistó a más de 300 emprendedores y expertos de la industria. generó entre Corea y México desde 1980. Esta brecha de prác-
ticamente el doble se explica en parte a causa de la innovación
Este artículo presenta un resumen de los principales hallazgos y entre los dos países. Mientras que el pago por regalías en Corea
recomendaciones. es de 144 dólares por habitante en México es de 6.5 dólares.

La versión completa del reporte está disponible en http://imco. Para resolver los retos de este factor a partir de política pública,
org.mx/banner_es/los-emprendedores-de-tic-en-mexico IMCO propone, entre otros:
• Modificar los incentivos del Sistema Nacional
INNOVACIÓN de Investigadores.
Este es el factor más rezagado de acuerdo a los emprendedores • Crear un mecanismo para dar viabilidad comercial a paten-
encuestados por el IMCO. Esto se debe principalmente a la baja tes tecnológicas.
inversión en investigación y desarrollo (I+D) en comparación con • Crear centros de vinculación entre los sectores público, pri-
otros países. Mientras que en México 30% de la inversión en I+D vado y académico.

008 SG.50
EMPRENDIMIENTO
I

ENTORNO PARA HACER NEGOCIOS • Crear programas de mentoría en etapas tempranas de


México está en el lugar 65 dentro del informe Doing Business 2016 las empresas.
del Banco Mundial en la categoría de apertura de empresas con • Realizar auditorías profesionales desde el primer año de
mayor facilidad. De acuerdo con el reporte, las economías donde existencia para establecer la gobernabilidad y salud finan-
es más fácil realizar negocios son aquellas cuyos gobiernos cuen- ciera de las empresas.
tan con un sistema regulatorio “inteligente”, con reglas diseñadas
para ser eficientes, accesibles a todo el que necesite recurrir a ellas, CAPITAL HUMANO
sobre todo las que son sencillas de aplicar y de bajo costo. De acuerdo a encuestas realizadas por Select al sector TIC, 66%
de las Pymes TIC tiene dificultad para contratar personal ca-
Mientras que en México las empresas dedican 347 horas al año lificado (56% para todas las empresas). Uno de los principa-
en promedio para pagar impuestos, en países como Noruega sólo les problemas es el bajo nivel de dominio del idioma inglés. A
dedican 87 horas. Además, México es uno de los países peor causa del modelo unidimensional de educación a nivel licencia-
evaluados en estado de derecho lo que afecta los tiempos para tura en México, los ingenieros en sistemas aunque cuenten con
ejecutar contratos por la vía legal (400 días con un costo de 31% una solidez técnica carecen de elementos de negocios como
del reclamo) mientras que en Singapur toma la mitad del tiempo. marketing, funcionamiento de mercados y acceso a capital.
Igualmente, los estudiantes de negocio carecen de las habilida-
Lo anterior desafortunadamente crea enormes oportunidades des técnicas para llevar a cabo un negocio en TIC. Lo anterior se
para la corrupción, considerada el principal obstáculo para hacer agrava porque México no facilita ni busca atraer talento TIC del
negocios en el país por 48% de los empresarios entrevistados por mundo; al contrario, se ve como una competencia poco desea-
el Banco Mundial en el reporte Doing Business. ble para los mexicanos.

Recomendaciones: Existen múltiples pendientes en materia educativa en el país que


• Establecer una ventanilla única digital para crear una em- contribuirán a mejorar este factor pero entre las principales ac-
presa (siguiente versión de tuempresa.gob.mx). ciones que IMCO propone están:
• Simplificar trámites como el pago de impuestos con tutoria-
les en línea y declaraciones pre-llenadas. • Alinear programas educativos con necesidades
• Generar tribunales especializados en temas de asuntos de de emprendedores.
propiedad intelectual y comercio electrónico. • Flexibilizar carreras de ingeniería para promover más habi-
lidades de negocios.
Nota del editor: La Cámara de Diputados aprobó el 9 de febrero la fi- • Facilitar la entrada de talento a México como visas para em-
gura denominada Sociedades por Acciones Simplificadas (SAS). Entre prendedores e investigadores.
los beneficios que promete está el registro de empresas en un solo día,
a costo cero y por internet. Esperamos que esto dé buenos resultados y FINANCIAMIENTO
mejore significativamente el entorno para hacer negocios. Pese a los avances del sector (53% de las empresas mexica-
nas entrevistadas considera que el acceso a financiamiento ha
INFRAESTRUCTURA DE APOYO mejorado en los últimos cinco años) los emprendedores en-
Aunque hace 10 años se impulsó la creación de incubadoras en trevistados lo consideran el segundo factor más rezagado. Por
México resultando en cerca de 500 instituciones en todo el país un lado, el mercado de capital de riesgo es mucho menor a
al 2012, sus resultados no han sido los esperados. Los expertos su potencial. En México se invierte 0.06% del PIB en dicho
coinciden que el modelo de incubadoras ha fallado por dos prin- mercado mientras que en Colombia y Chile se invierte el doble
cipales causas: (1) las incubadoras no agregan valor, pues sus di- en términos relativos. Por otro lado, el mercado de crédito a
rectivos y consultores carecen de experiencia empresarial y (2) las empresas es limitado. En 2010, el porcentaje de crédito a
no cuentan con fuertes vínculos con el sector productivo. La po- empresas representó 21% del PIB mientras que el promedio
lítica de financiamiento de las incubadoras es perversa pues de- latinoamericano fue 36%. Como resultado, los emprendedo-
pende del número de empresas que creen, independientemente res tienden a financiar sus proyectos con fondos personales y
de su éxito. Solo una de cada siete incubadoras da algún tipo tiene familiares (58% de los emprendedores en TIC declaran haber
algún sistema de seguimiento de sus empresas. Lo anterior ex- utilizado fondos personales). Las razones de estos resultados
plica por qué 70% de los emprendedores que han conseguido fi- se encuentran en: las limitaciones de los emprendedores a
nanciamiento en el mercado no provienen de alguna incubadora. entender los requerimientos del sector financiero de contar
con estados financieros completos, gobernanza corporativa y
Recomendaciones: transparencia financiera. También se explica por la poca par-
• Cambiar los incentivos a las incubadoras a través de otor- ticipación de individuos con alta capacidad de inversión en el
gar recursos públicos con base en el impacto que tengan mercado de capital emprendedor. Los empresarios mexicanos
sus empresas (empleos, ingresos, etc.). En este sentido, el prefieren invertir en sectores tradicionales que en nuevos mer-
primer paso es transparentar y evaluar los fondos erogados cados, lo cual ha inhibido la creación de inversionistas ángel.
por la incubadora y limitar los apoyos a periodos cortos Otra barrera son las limitadas salidas a mercado, por ejemplo,
(como de un año) para evitar la dependencia de las empre- los requisitos para realizar una oferta pública son complicados
sas con la incubadora. y están dirigidos a empresas de mayor tamaño.

SG.COM.MX 009
I EMPRENDIMIENTO

Recomendaciones: habilidades empresariales y conocimientos, tienen 8.5% de ma-


• Introducir esquemas de financiamiento diseñados para cada yor probabilidad de emprender un negocio.
etapa de desarrollo de las empresas. A la par se puede trabajar
con la Bolsa Mexicana de Valores (BMV) para generar esque- Además, aquellos que no le tengan miedo al fracaso tienen una pro-
mas de ofertas públicas para un mercado de menor escala. babilidad 10% mayor a emprender. Finalmente, el conocer a un em-
• También se puede utilizar un scoring psicométrico como prendedor aumenta la probabilidad de emprender en 3%. En México
mecanismo para el otorgamiento de créditos al menos en los esta cultura no se ha consolidado. En una encuesta realizada por
fondos públicos y así contrarrestar la falta de colateral e his- Grupo Monitor (Deloitte) el porcentaje de individuos que considera
torial crediticio. empezar un negocio como una buena alternativa es 58%, mientras
• Asegurar que las inversiones de los fondos vengan acompa- que en Brasil es de 80%. Las razones, según los expertos, es que no
ñadas de capacitación y mentoría de calidad. existe la cultura de mentoría en México entre los empresarios más
experimentados debido a la falta de interés y falta de mecanismos y
PERFIL DE LA DEMANDA eventos para que interactúen. Por otro lado, no hay visibilidad de los
Este factor se refiere a la capacidad de un país para adoptar y casos de éxito de emprendedores en la sociedad. Otra característica
promover el consumo de emprendimientos TIC. Su relevancia se de México es que no existe una cultura de riesgo ni de fracaso y no ha
debe a que aquellas pequeñas empresas que más crecen son las quedado claro qué es ser emprendedor. De acuerdo a encuestas de
que usan de forma permanente las TICs para relacionarse con sus la Secretaría de Economía sobre incubadoras, no hay claridad sobre
clientes de acuerdo a un estudio reciente de BCG. Sin embargo, el los tipos de sociedades mercantil óptimas, rondas de negociación
comercio electrónico en Brasil representa tres veces el de México con un inversionista, o maneras de presentar un proyecto.
en relación al PIB, debido principalmente a: el alto costo y baja
calidad del acceso a internet, la baja penetración de servicios Recomendaciones:
bancarios, y la poca confianza en el comercio electrónico. • Aumentar la promoción de sitios web gubernamentales y
redes sociales para los emprendedores exitosos.
Recomendaciones: • Facilitar eventos o concursos como los Hackatones o pasa-
• Aumentar los acuerdos bilaterales para que las empresas relas de emprendedores.
mexicanas cumplan con los requisitos de comercio electró- • Otorgar becas para emprendedores de menores ingresos
nico de otros países. para continuar con sus proyectos.
• Adoptar estándares internacionales de seguridad y privaci-
dad de datos personales alrededor de internet. ESTRATEGIA GUBERNAMENTAL
• Abrir el Servicio Postal Mexicano a la competencia. Este es el factor que se encuentra en mejor estado de acuerdo a
los expertos entrevistados por IMCO. En particular se reconoce la
INTEGRACIÓN DE LA INDUSTRIA TIC. labor de la política pública en crear apoyos a fondos logrando que
Aunque en términos generales la industria TIC se encuentra integrada se duplicaran en 6 años, crear los primeros fondos de capital se-
bajo 3 principales asociaciones y 38 clústers en 28 estados, esto no milla en el país y vincular a las universidades públicas con proyec-
necesariamente se refleja en las nuevas empresas. De acuerdo con la tos emprendedores a través de encuentros entre emprendedores
encuesta realizada por IMCO, solo 23% de los emprendedores TIC y el sector. Muestra de esto es que 73% de los emprendedores
pertenece a una asociación empresarial y 28% a un clúster. Pese a los encuestados declara haber asistido a un evento organizado por
logros de Prosoft y la mayor integración que perciben los empresarios el gobierno. Sin embargo, aún quedan importantes retos que re-
de los clusters (ITAM) no hay mecanismos para vincular empresas solver: 93% de los emprendedores encuestados considera que
que se están formando con la comunidad empresarial TIC. Los me- hay demasiados programas de apoyo y son complicados de ac-
canismos privados de asociación son caros para los emprendedores ceder; prueba de ello es que hay gestores que pueden cobrar por
por las cuotas y aunque lo pudieran pagar, no encuentran sus intereses asesorar para conseguir recursos. Por otro lado, se encontraron
representados. Para los emprendedores entrevistados no está claro 133 programas para investigación y desarrollo pero 97% de los
que se tengan métricas de éxito de los clústers de software y más bien emprendedores considera que no se ajustan a sus necesidades.
encuentran a la mayoría de éstos desactualizados. Además 88% de los emprendedores señala que la información
de los programas no se entiende fácilmente y que los recursos
Recomendaciones: llegan de forma lenta. Otro aspecto que señalan es la falta de
• Hacer planes regionales para los clústeres de nueva gene- seguimiento a programas y mecanismos de salida lo que puede
ración y nichos de especialización que aseguren que éstos generar dependencia a dichos programas.
cuentan con los requisitos básicos para su éxito.
• Facilitar que los emprendedores se inserten en la cadena de Recomendaciones:
valor de un clúster por medio de incentivos fiscales. • Fortalecer y mejorar el sitio web creado por el INADEM en
el cual se concentran algunos de los recursos públicos y pri-
CULTURA EMPRENDEDORA vados para emprendedores.
De acuerdo a un estudio académico (Ardagna & Lusardi 2008), • Diferenciar las políticas por etapa de emprendedor y evaluar
este factor es uno de los que mejor explica la probabilidad de dichos programas a través de un tercero cuyos resultados se-
emprender en un país. Si los individuos tienen confianza en sus rían públicos.

010 SG.50
SG.COM.MX 011
R REPORTAJE

Industria de Software en Colombia



Por Alejandra Jiménez

Continuando nuestra serie de repor- que equivaldría a una Secretaría en • Generar 369 mil empleos en TI.
tajes sobre la industria de software en México) dedicado únicamente al sec- • Ubicar al menos una ciudad de
distintos países de Latinoamérica, hemos tor de Tecnologías de Información y Colombia en el Top 25 del mundo para
decidido dedicar este número a estudiar Comunicaciones [1]. negocios TIC.
el caso de Colombia. El Ministerio de Tecnologías de la Información • Certificar como ciudadanos digitales
y las Comunicaciones (MinTIC), es la entidad a 2,5 millones de funcionarios públicos
Todos los que nos dedicamos al software que se encarga de diseñar, adoptar y promo- para que se apropien de la tecnología.
hemos visto la importancia que ha estado ver las políticas, planes, programas y proyec- • Impulsar teletrabajo. La meta es lle-
cobrando poco a poco este país en nues- tos de este sector. gar a los 120 mil teletrabajadores.
tra industria. Ya sea como un mercado de • Enfocar el servicio social obliga-
servicios de tecnología, un lugar desde El Plan Vive Digital [2] fue lanzado en torio para que los estudiantes en-
donde hacer outsourcing aprovechando 2010 para impulsar la masificación del señen a sus comunidades sobre las
el talento local, o una fuente de startups uso de Internet con el fin de reducir la po- nuevas tecnologías.
tecnológicos, Colombia se ha estado ga- breza y generar empleo. Ha representado
nando la mirada de muchos de nosotros a un gran salto tecnológico a nivel nacional, Apps.co [3] es la iniciativa de MinTIC
través de los últimos años. involucrando a todas las entidades guber- enfocada en apoyar el emprendimiento
namentales del país. Los 4 ejes de este tecnológico. Para lograr esto ofrece
Conozcamos entonces un poco sobre cómo plan, y que actualmente se siguen promo- servicios y programas para atender al-
es que la industria de TIC de Colombia ha viendo, son: aplicaciones, usuarios, servi- gunas de las principales necesidades
llegado hasta aquí, y qué es lo que sigue. cios e infraestructura. de los emprendedores, tales como:
ayudarlos a desarrollar sus ideas de
MINTIC: IMPULSANDO LA INDUS- Actualmente el plan se encuentra en su emprendimiento, conectar con inver-
TRIA DESDE EL MÁS ALTO NIVEL segunda iteración (2014-2018) y entre sionistas, ayudar a difundir sus pro-
Colombia tiene el caso particular y no- sus metas, las siguientes son algunas de ductos/servicios, y brindar acceso a
table de contar con un Ministerio (lo las que más nos llaman la atención: recursos de capacitación en línea.

Alejandra Jiménez es editora y escritora enfocada en temas de tecnología y emprendimiento. Facilitadora de Startup Weekend desde 2012. Ha sido colaboradora de publicaciones como
PulsoSocial y Fayerwayer.

012 SG.50
REPORTAJE
R

Colombia no es ajeno a la necesidad glo- estándares internacionales, ayudar a facilitar la evolución económica de la ciu-
bal de más y mejor talento en desarrollo de identificar necesidades de la industria dad hacia negocios intensivos en ciencia,
software, y para ello MinTIC cuenta con la en formación, planeación para conver- tecnología e innovación, de forma inclu-
iniciativa Talento Digital [4], con la que se tirlas en metas reales. yente y sostenible. Su objetivo al año 2021
busca formar a miles de profesionales en 2. Posicionamiento global. Dedicado es posicionar a Medellín como la ciudad
TI. Por medio de este programa se ofrecen a posicionar a la industria colombiana más innovadora de América Latina.
créditos condonables en distintos porcen- como productor de software, facilitar a
tajes en el pago de colegiaturas, buscando sus empresarios participación en ferias, Otro buen punto de entrada al eco-
con ello atraer a más jóvenes a las carreras entrenamientos gerenciales —no solo sistema local es el programa Medellín
relacionadas con TI. De hecho, a esta inicia- dentro de Colombia sino en otros países. Emprendedora. Lo conforman un conjunto
tiva se han destinado recientemente 96.3 3. Talento humano. Divulgar activida- de entidades que apoyan a los empren-
millones de dólares, que serán distribuidos des de formación técnica y profesional, dedores para realizar sus proyectos, im-
en un período de 3 años (2015-2018) para procesos de calidad y asegurar que pulsar y/o fortalecer emprendimientos.
beneficiar a los ciudadanos colombianos esta información llegue al sector. Es una de las apuestas del gobierno de
interesados en formación académica en 4. CENIsoft. Centro de Investigación Medellín por convertir a su ciudad en uno
carreras relacionadas con TI. especializado en la industria de software, de los referentes de tecnología y creación
creado por Fedesoft para que sus de startups a nivel nacional y regional con
COLOMBIA DIGITAL afiliados desarrollen estudios e investi- proyección internacional.
Es una corporación que surge en 2002 gaciones, establezcan alianzas con otros
para promover el uso y apropiación de organismos e instituciones educativas y En cuestión de espacios, destaca el Parque
las tecnologías de información y las co- se genere un observatorio de TI. del Emprendimiento, un espacio físico de
municaciones, en beneficio del desarrollo 1,000m2 que ofrece servicios de hospe-
social y económico. Su trabajo se basa en Ximena comenta que: “la industria de TI daje y aceleración a nuevos emprendi-
3 enfoques: está creciendo, porque la infraestructura mientos de base tecnológica.
• Fortalecer la adopción y uso de TIC y el gobierno lo han facilitado, y a su vez
en la sociedad, orientados al mejora- esto genera una mayor demanda de pro- SALARIOS EN COLOMBIA
miento de su calidad de vida. ductos y servicios de TI.” De acuerdo a una encuesta realizada re-
• Promover la competitividad de las cientemente por la comunidad Colombia
organizaciones públicas y privadas, Gobierno y FEDESOFT apuestan por TI bajo Dev, el salario medio para un desarrolla-
utilizando las TIC. la premisa de que esta actividad es transver- dor de software en Colombia es de alrede-
• Apoyar la formulación, implemen- sal en la economía, y es por esto que en los dor de $1,100 dólares al mes. Al igual que
tación y apropiación de políticas TIC, programas de la Federación se busca una en el caso de México, esto puede subir
en escenarios de gobierno colom- articulación con iniciativas lanzadas desde drásticamente dependiendo de la expe-
biano y global. MINTIC o el Ministerio de Educación. riencia, el dominio del lenguaje inglés y las
tecnologías utilizadas. Para mayor infor-
Son una organización de carácter mixto EL CASO DE MEDELLÍN mación recomendamos el análisis hecho
cuyos fundadores provienen de los sec- Aunque Bogotá es la capital y ciudad más por nuestros colegas de Make it Real [7].
tores académico, empresarial y gobierno. grande de Colombia, reuniendo cerca de
Hoy, Colombia Digital es una corporación 10 millones de habitantes en su zona me- CONCLUSIÓN
independiente que no depende de nin- tropolitana, es en Medellín donde hay más Colombia está decidida a posicionarse
guna instancia pública o privada, y actúa dinamismo en términos de innovación como jugadora clave a nivel mundial en
bajo un modelo de auto-sostenibilidad ba- y emprendimiento tecnológico. A nivel la industria de software. Cuenta con una
sado en la gestión de proyectos mundial es considerada como una de las oferta de valor interesante, y parece estar
ciudades con los mejores programas para avanzando a buen ritmo. Sin duda es una
FEDESOFT apoyar la generación de nuevas empresas gran adición al equipo de “Latam IT”.
La Federación Colombiana de la Industria y startups, y en 2013 obtuvo el reconoci-
del Software y Tecnologías Informáticas miento por parte del Wall Street Journal
Relacionadas (Fedesoft) es el gremio de la como la ciudad más innovadora del Referencias
industria de TI en el país, con 27 años de mundo, por encima de los finalistas Nueva [1] http://www.mintic.gov.co
existencia y 410 empresas afiliadas hasta York y Tel Aviv. Medellín es, sin duda, un [2] http://vivedigital.gov.co
el momento, en su mayoría nacionales. referente cuando se habla de tecnología e [3] http://apps.co
Ximena Duque, Directora de Empresas innovación. [4] http://talentodigital.gov.co
Competitivas dentro de la Federación, nos [5] http://www.colombiadigital.net
comenta que son 4 las áreas de trabajo: Destaca el caso de Ruta N, una corpora- [6] http://www.medellinemprendedora.net
ción creada por la Alcaldía de Medellín [7] http://rutanmedellin.org
1. Empresas competitivas. Enfocado con conjunto con UNE y EPM (empresas [8] http://parquedelemprendimiento.com
en medir índices de competitividad, locales proveedoras de servicios públicos [9] http://blog.makeitreal.camp/
ventas, que sus empresas cuenten con y de telecomunicaciones), con el fin de analisis-encuesta-desarrolladores-colombia-2016

SG.COM.MX 013
R REPORTAJE

Voces de
Colombia

Como parte de nuestro reportaje Afortunadamente hay organizaciones en ciudades del país (Medellín, Barranquilla,
sobre Colombia, compartimos aquí la Colombia que están entendiendo lo que re- Pereira), en donde las reuniones mensuales
opinión y perspectiva de personas que co- presenta ofrecer una cultura de ingeniería y permiten un intercambio de conocimientos
nocen este ecosistema de primera mano. un ambiente en donde el talento local desea- entre sus participantes, y se abre espacio
ría trabajar, algunos ejemplos son: Koombea, para que los miembros de la comunidad
JUAN PABLO BURITICÁ S4N y Monoku, las tres encargadas de tra- compartan sus experiencias. El impacto
Juan Pablo es un desarrollador de origen co- bajar en soluciones digitales que van desde de estas comunidades se ha transformado
lombiano. Actualmente es VP de ingeniería desarrollo, diseño hasta consultoría. Son en conferencias a nivel nacional. JSConf
en ride.com basado en Nueva York y cuenta ejemplos de que las empresas de consultoría Colombia, con dos ediciones, ya es un
con un equipo de ingenierios trabajando también pueden hacerse interesantes aun- evento de relevancia internacional.
desde Colombia. Adicionalmente es co-or- que sirvan a un mercado de servicios.
ganizador de JSConf Colombia, cofundador SOBRE LA VISIÓN DE LAS NUEVAS
de la comunidad Colombia Dev y frecuente- SOBRE LOS ESFUERZOS DEL GENERACIONES
mente escribe y habla sobre el desarrollo de GOBIERNO PARA CONSTRUIR La tecnología que tenemos en muchos de los
talento y servicios digitales desde Colombia. SERVICIOS DIGITALES servicios que se ofrecen a la ciudadanía están
Creo que es importante aclarar que una basados en softwares de gestión de hace 10-
SOBRE EL (SUPUESTO) DÉFICIT DE cosa es TI y otra son servicios digitales. 15 años. Dos o tres compañías en Colombia
INGENIEROS DE SOFTWARE El lenguaje es erróneo, yo no hago TI, yo son las que se siguen contratando para so-
El problema nace en la industria, hay una construyo servicios digitales. portar tecnología vieja con contratos millo-
brecha entre lo que la industria demanda narios; hay miedo ante las nuevas startups,
y lo que buscan las nuevas generaciones. El gobierno hace intentos, como por ejem- con mejor tecnología y mejores visiones, que
Desgraciadamente es común ver al inge- plo, la implementación del Código Postal o pueden hacer las cosas mejor y con costos
niero de software como algo cercano a un servicios digitales, pero son demasiado difí- menores. Las empresas tecnológicas nuevas
obrero, porque es visto desde la perspectiva ciles de usar. Creo que no tiene personal re- y las startups, ya no ven coherencia en rela-
de la maquila, sin innovación. Ese es el reto querido para construir este tipo de servicios cionarse, por ejemplo, con FEDESOFT. Ahora
que tiene gobierno, satisfacer la demanda de de forma adecuada. Se requiere una menta- el impulso a desarrollar software, con nuevas
empresas con tecnología, visión y sistemas lidad más abierta y transparente. Por ejem- tecnologías se da, principalmente por parte
obsoletos cuesta cada vez más trabajo. Si tú plo, en Estados Unidos hay una iniciativa de de comunidades tecnológicas y estudiantiles,
vas a una universidad en Colombia, digamos, la Casa Blanca llamada U.S. Digital Services, y las startups surgen porque son empresas
al 1er semestre de la carrera de ingeniería en que reconoce que la forma de interactuar enfocadas en resolver problemas muy pun-
software o sistemas, nadie quiere trabajar en con el gobierno es muy complicada y con- tuales. La tecnología ya no es solo el interés
la industria local; el estigma contra la ingenie- voca a los ciudadanos para que se integren de unos pocos, o de los ingenieros de en sis-
ría es un problema de mercado, no técnico. a equipos y apliquen técnicas de diseño de temas, la tecnología ha encontrado espacios
Los ingenieros graduados quieren trabajar productos para definir y construir servicios en todas las ramas. Veo en nuestras reunio-
en empresas internacionales, muchos dirán digitales sencillos y útiles. Así que en ese nes a artistas, abogados, activistas de dere-
Google, Facebook, pero otros tantos solo sentido, siento que lo que le hace falta, más chos humanos, ya es un ecosistema diverso.
buscan lugares donde pueden sentir orgullo que un Ministro de TIC, es un CTO.
de crear, lugares donde exista una verdadera SOBRE LA EDUCACIÓN
cultura de ingeniería, donde se pueda inno- DANIEL ARISTIZABAL La educación tradicional está basada en cas-
var. Un ingeniero busca ser ingeniero en su Daniel es un artista gráfico y desarrollador tigo e incentivo, se incentiva la inteligencia
trabajo; las startups son eso, laboratorios de colombiano. Junto a Juan Pablo Buriticá lógica, la memorización, y si no memorizas,
ingeniería con recursos limitados pero sufi- inició la primer comunidad de JavaScript castigo. No se desarrollan otras habilidades,
cientes para trabajar en un problema especí- en Colombia, BogotaJS, hace ya 4 años. no se enseña a manejar riesgos, ni hay un
fico y puntual por un espacio de tiempo. Este formato se ha replicado ya en otras enfoque a otro tipo de inteligencias, como

014 SG.50
REPORTAJE
R

la emocional, la financiera o la social. Aun considerado como el actor principal, dado EDWARD RAMÍREZ
así, creo que algunas iniciativas promovidas que si la política pública sufre cambios o Edward Ramírez es fundador de Partners
desde gobierno como Apps.co y ViveLab considera que los objetivos deben ser otros; 4 Startups (p4s.co), una comunidad que
son interesantes para quienes desean em- todo el sector podría verse afectado. Los conecta a personas de distintas espe-
prender y acercarse a la tecnología. protagonistas deben ser las personas, las cialidades interesadas en el emprendi-
comunidades y las organizaciones, teniendo miento tecnológico. Con el objetivo de
ALEXANDER RICAND como propósito el beneficio común. dar visibilidad a la comunidad tecnoló-
Alexander es Director del Departamento gica, en 2015 compitió por una posición
Administrativo TIC de la Alcaldía de Considero que se debe continuar traba- en el Concejo de Bogotá.
Tuluá. Considera que el ingenio y talento jando en dos importantes elementos. El
colombiano se ha destacado en varias primero es la generación de más escena- SOBRE EL ENFOQUE DEL GOBIERNO
áreas del conocimientos, siendo la indus- rios para que en etapas tempranas quienes Es crucial explorar cómo se pueden
tria del software una de ellas. A pesar de tienen habilidades, talentos e intereses en coordinar los esfuerzos entre el gobierno
ello, considera que la escasez de talento la industria TI se sigan conectando y ex- y las comunidades independientes.
suficiente es un problema real y opina: plorando sus habilidades, por eso eventos También es importante cambiar un poco
“se estima que el país para 2018 tendrá como Hackatones, Startup Weekend, en- la orientación de objetivos políticos,
un déficit de Talento TI superior a los tre otros son importantes. debido a que actualmente se termina
80,000 ingenieros y profesionales en la apoyando a apuestas de corto plazo, in-
industria, hecho que preocupa dadas las El otro elemento es la consolidación de mediatas, dejando de lado apuestas más
condiciones competitivas en la región”. talentos en etapa madura para el diseño, ambiciosas que requieren mayor trabajo
servicio y soporte de soluciones para el y tiempo. Adicionalmente, el Gobierno
SOBRE EL ROL DEL GOBIERNO mercado global, pues en la actualidad está incentivando al sector como nunca
El Gobierno en todos sus niveles, puede in- son pocas las empresas locales que cuen- antes; existen muchos programas de
cidir en la generación de nuevos y mejores tan con infraestructura y experiencias en apoyo pero ante la comunidad no se lo-
escenarios para la industria TI. Por supuesto, prestación masiva de servicio y cuando gran visualizar de forma integrada, pare-
hay que tener claro que su papel debe ser de hablamos de masivo nos referimos a gran- cieran esfuerzos dispares que persiguen
articulador, en ningún momento puede ser des porciones de usuarios finales. objetivos independientes.
O RADAR

2 MANTL

1 WEBVR

Mantl es una platforma para gestionar la instalación y ope-


ración de microservicios en infraestructura distribuida. El
enfoque de Mantl es brindar una solución completa, que
WebVR es un API de Javascript que permite que aplicaciones web pue- resuelva todos los aspectos de gestión de microservicios,
dan interactuar con dispositivos de realidad virtual, como el Oculus Rift de manera que los desarrolladores no tengan que estarse
o Google Cardboard. De esta manera, una aplicación web podría recibir preocupando por la infraestructura y pueda enfocarse en
eventos o información generados por el visor, y de la misma manera la funcionalidad de los servicios que construyen. Mantl
enviar eventos e información que alimenten escenarios 3D en el visor. está basado en estándares y opera con distintos provee-
Esto se puede aplicar a diversos escenarios tales como tours virtuales, dores y tecnologías tales como Openstack, AWS, Vagrant,
entrenamiento interactivo, y juegos altamente inmersivos. o directamente en el hardware (bare metal).

WebVR es un proyecto open source respaldado por Mozilla. Mantl es open source y es desarrollado y soportado por
Recientemente liberó su versión 1.0, y es soportado en el nightly build Cisco Systems, como parte de sus esfuerzos para aden-
más reciente de Firefox y Chrome. trarse en el ecosistema DevOps.

Más información en http://mozvr.com Más información en http://mantl.io

3 KOTLIN
4 SQL SERVER 2016

Jetbrains, la empresa creadora de IDEs como IntelliJ y Se requiere bastante para que en pleno 2016 nos podamos entusias-
TeamCity, liberó la versión 1.0 de Kotlin, un lenguaje de mar por un servidor de base de datos relacionales, pero debemos
programación para la máquina virtual de Java. confesar que SQL Server 2016 lo está logrando. Entre las capacida-
des que incluirá destacan:
Kotlin es descrito como un lenguaje “pragmático”, para
aquellos desarrolladores que buscan un lenguaje con • Podrás utilizar R directamente en la base de datos para realizar
capacidades modernas para mayor productividad, pero análisis estadístico, sin necesidad de estar exportando los datos.
que sea compatible con el resto de la plataforma Java. • Stretch Database, permite que una misma base de datos tenga
Kotlin combina capacidades de orientación a objetos y algunas particiones almacenadas localmente y otras en la nube
programación funcional, y está enfocado en la interopera- (via Azure SQL Database) La intención sería tener los datos de
bilidad, estabilidad e integración con herramientas. mayor uso localmente y los datos que son accedidos con menos
frecuencia en la nube, para mitigar costos de almacenamiento.
Kotlin es open source y se ha estado desarrollando desde • Polybase, el conector para Hadoop incluido en Analytics
hace más de 5 años. Platform System, también está en SQL Server 2016.
• Soporte a JSON, facilitando el almacenamiento y manipulación
Gracias a su completa compatibilidad con Java, Kotlin de datos con este formato.
parece ser una buena alternativa para desarrollar aplica-
ciones Android. SQL Server 2016 actualmente se encuentra disponible como
Community Technology Preview y se espera que la versión para pro-
Más información en https://kotlinlang.org ducción sea liberada antes de la mitad del año.

016 SG.50
TENDENCIAS
EN SOFTWARE
C

El Fin de la Era del “Big Data”


Por Luis Daniel Soto Maldonado

Las decisiones se están evaporando de nuestra Esta situación se presenta hoy en la industria médica
vida: hoy nos encontramos utilizando apps y el inter- y la aeronáutica, con una sobre-dependencia en sis-
net para decidir qué libro leer, en dónde cenar, qué temas informáticos. Si no hay sistema, no hay capa-
película ver en el cine, qué programa ver en televisión, cidad de actuar. Nunca habíamos alcanzado los
qué música escuchar, en qué acciones invertir y a qué actuales niveles de seguridad y confiabilidad en segu-
amigos felicitar. Las máquinas de búsqueda deciden ridad aérea, pero los pilotos tienen control manual de
cómo comenzaremos a navegar la red. Una tercera un avión solo unos pocos minutos por vuelo. Aunque
parte de los matrimonios en Estados Unidos se ori- hay beneficios, los pilotos están perdiendo sus habi- Luis Daniel Soto (@luis-
ginan por citas en línea, un algoritmo inteligente y lidades básicas por el exceso de automatización. En dans / @luisdanielsoto)
aprendizaje de máquina decide quiénes son “compa- situaciones de emergencia, no son capaces de recu- trabaja en Amazon Web
tibles”. Las máquinas ya hacen más de lo que creemos perar el control y fallan en evitar accidentes. Services, enfocado en el
que son capaces. desarrollo global de ne-
Un debate que inició hace dos siglos está reciente- gocios para Big Data e
El cáncer no se remediará con un medicamento mila- mente cobrando mayor relevancia: la separación entre Inteligencia de negocios.
groso, no es un solo tipo. El problema de esta terrible hombre y máquina. ¿Cuándo una maquina será capaz sotols@amazon.com
enfermedad posiblemente se resolverá con aprendi- de escribir una obra de arte? Las computadoras de
zaje de máquina. Se requiere un sistema inteligente, hoy pueden, con facilidad, juzgar el éxito de un libro.
capaz de entender cuál es el medicamento apropiado Pero, ¿por qué no escribir un “Don Quijote”, “Las Mil
para cada persona, capaz de conocer profundamente y una Noches” o “Cien Años de Soledad”? Estamos
los hábitos del enfermo, sus antecedentes familiares, en ese camino. Creo que las computadoras ofrecerán
su DNA, su historia médica, las mutaciones de la cán- cientos de puntos de partida para que la creatividad
cer, los resultados de otros tratamientos. humana llegue mucho más allá.

Es así que la era de “big data” finalmente está lle- Los algoritmos y robots súper-inteligentes nos expon-
gando a su fin. No es porque se haya implementado drán a sentimientos que nunca anticipamos por las
en la mayoría de las empresas, o porque las mismas máquinas. Hoy son solo búsquedas de texto muy
ya hayan descubierto la riqueza de tomar decisiones complejas, pero la búsqueda por el algoritmo del
verdaderamente informadas y en tiempo casi real. No, aprendizaje de cualquier cosa es el problema clave a
lo que sucede es que estamos entrando a una nueva resolver. Esos sistemas llegarán con nuevas implica-
etapa en donde el uso de los datos permite el ver- ciones éticas, políticas y sociales.
dadero aprendizaje de máquina. El conocimiento se
empieza a acumular: aunque estamos distantes del Regresemos a nuestro punto de partida. Empecemos
auto que se conduce por sí mismo en un ambiente por definir cómo evaluaremos dichas tecnologías,
real, los vehículos autónomos que se están desarro- quien estará a cargo de la nueva Inteligencia Artificial
llando cuentan ya millones de horas de aprendizaje, en la organización y qué implicaciones brindan a
realizando la tarea de aprender haciendo. nuestros modelos de negocio . Aún no hemos visto
todos los actos de magia de la tecnología.
Reflexionemos cómo hemos llegado aquí. La vida
mecanizada no es lo que se pensó algunas décadas
atrás. Los empleos del conocimiento están siendo Si te interesa leer más sobre máquinas y algoritmos inteli-
más fáciles de automatizar que los de labor manual, gentes, te recomiendo que visites el compendio de artícu-
como el trabajador de construcción. Todos esperamos los que he creado en Flipboard: http://swgu.ru/re
robots que puedan verdaderamente realizar labores
domésticas, pero esto conlleva implicaciones consi-
derables como la pérdida de capacidades básicas del
hombre, gracias a estos mismos avances.

SG.COM.MX 017
T PANORAMA

Un Vistazo a
Apache Spark Streaming

Por Pedro Galván

Apache Spark es un framework open source para el procesa- que cuando usamos Spark Streaming para alimentar un stream a
miento de datos masivos diseñado con tres prioridades en mente: Spark Core, éste último los analiza de forma normal, sin enterarse
velocidad, facilidad de uso, y capacidades avanzadas de analítica. de que está procesando un flujo de datos, porque el trabajo de
crear y coordinar los RDDs lo realiza Spark Streaming.
Spark está cobrando gran popularidad porque viene a resolver
varias de las limitaciones inherentes de Hadoop y MapReduce.
Spark puede utilizarse junto con Hadoop, pero no es requisito.
Spark extiende el modelo MapReduce para hacerlo más rápido y
habilitar más escenarios de análisis, como por ejemplo queries inte-
ractivos y procesamiento de flujos en tiempo real. Esto es posible
ya que Spark usa un cluster de cómputo en memoria (in-memory). Figura 1. Spark Streaming prepara un flojo para que Spark Core lo pueda consumir.

Uno de los elementos clave de Spark es su capacidad para pro-


cesamiento continuo (stream processing). Esto se logra por medio
del componente Spark Streaming. En este artículo brindamos un
vistazo de cómo funciona Spark Streaming .

Descripción general Figura 1. Spark Streaming genera RDDs por intervalos de tiempo.
Spark Streaming puede ingerir datos de un amplio de fuentes,
incluyendo flujos provenientes de Apache Kafka, Apache Flume,
Amazon Kinesis y Twitter, así como de sensores y dispositivos Orquestación del cluster
conectados por medio de sockets TCP. También se pueden pro- La figura 3 muestra a grandes rasgos cómo opera la orquesta-
cesar datos almacenados en sistemas de archivos como HDFS ción del cluster. Las actividades son orquestadas por un programa
o Amazon S3. conocido como Driver. Este programa típicamente instancía a
SparkContext para realizar la orquestación de los procesos ejecu-
Spark Streaming puede procesar datos utilizando una variedad de tores, que son los que operan sobre los datos.
algoritmos y funciones tales como map, reduce, join y window.
Una vez procesados, los datos son enviados a archivos en file sys- En el caso de aplicaciones basadas en streams, se uti-
tems o para popular dashboards en tiempo real. liza StreamingContext en lugar de SparkContext, ya que
StreamingContext soporta DStreams.
A grandes rasgos, lo que hace Spark Streaming es tomar un flujo
de datos continuo y convertirlo en un flujo discreto —llamado Como podemos ver, el Driver es un punto central de operación,
DStream— formado por paquetes de datos. Internamente, lo así que es importante mitigar las posibilidades de que falle. Spark
que sucede es que Spark Streaming almacena y procesa estos Streaming soporta un concepto llamado “checkpointing” que ase-
datos como una secuencia de RDDs (Resilient Distributed Data). gura que todos los datos y metadatos asociados con RDDs que
Un RDD es una colección de datos particionada (distribuida) e forman flujos de datos son replicados continuamente a un alma-
inmutable. Es la unidad de información que el motor de proce- cenamiento tolerante a fallas. Esto permite que en caso de una
samiento de Spark (Spark Core) tradicionalmente consume. Así falla del driver se puedan recuperar y procesar el flujo de datos.

Pedro Galván Kondo es cofundador y director editorial de Software Guru.

018 SG.50
PANORAMA
T

Estrictamente, Spark Streaming no opera en


base a flujos continuos, sino a micro-batches.

Bajo un modelo “at least once”, tenemos la garantía de que aunque


haya alguna falla en algún nodo, no perderemos datos ya que cuando
el nodo se recupere (o se reasigne su carga a otro) éste procesará
todos los datos para asegurar que no se le vaya ninguno. Trasladando
esto a nuestro ejemplo de streaming de un video, lo que sucedería
es que todos los datos con buena calidad pero corremos el riesgo de
que se repitan pedazos que ya habíamos visto. Al usar este modelo
debemos buscar que las operaciones en nuestro código sean idem-
potentes, es decir que siempre produzcan el mismo resultado sin
Figura 3. El driver orquesta el cluster de procesamiento. importar si han sido ejecutadas anteriormente (por ejemplo, x = 4
es idempotente pero x++ no lo es). De esta manera, no importa si
procesamos un dato varias veces, ya que en ambas ocasiones nos
Modelos de procesamiento generará el mismo resultado y podemos filtrar en base a esto.
Spark Streaming soporta distintos modelos correspondientes a
las semánticas típicamente utilizadas para el procesamiento de Aunque el modelo “exactly once” es lo que parecería lógico que
flujos. Esto asegura que el sistema entrega resultados confiables, siempre debamos escoger, en realidad no es necesario en todas
aún en caso de fallas en nodos. Los flujos de datos pueden ser las ocasiones y hay que tener cuidado al escogerlo. Debemos
procesados de acuerdo a los siguientes modelos: entender que este modelo es el más intensivo en recursos y
puede ocasionarnos problemas de desempeño debido a todo el
• Exactamente una vez (exactly once). Cada elemento es procesamiento adicional que se requiere para asegurar que cada
procesado una sola vez. uno de los datos no se pierda ni se duplique. Adicionalmente, si
• A lo más una vez (at most once). Cada elemento puede nuestro código es idempotente, con un modelo at least once ten-
ser procesado máximo una vez, y es posible que no sea dremos resultados confiables.
procesado.
• Por lo menos una vez (at least once): Cada elemento debe Consecuencias de micro-batches
ser procesado por lo menos una vez. Esto aumenta la posibi- Como ya vimos, estrictamente Spark Streaming no opera en base
lidad de que no se pierdan datos pero también es posible que a flujos continuos sino a micro-batches que tienen un tiempo de
se generen duplicados. intervalo entre ellos (típicamente de menos de 5 segundos). Es
importante que entendamos las consecuencias que esto puede
No todos estos modelos son soportados con todos los tipos de tener. Por un lado, se puede configurar y reducir el intervalo a
fuentes de datos. Es necesario verificar cuáles semánticas se menos de un segundo, lo cual nos daría un desempeño casi de
soportan en cada una. tiempo real, pero con un alto costo en recursos de procesamiento.
Adicionalmente, un argumento en contra del esquema de micro-
Desde un punto de vista de procesamiento, el modelo más sen- batches es que puede ser que los datos no se reciban en el orden
cillo de construir es “at most once”. Lo que implica este esce- exacto en el que sucedieron. Esto puede o no ser relevante depen-
nario es que es aceptable que ocasionalmente haya pérdida de diendo de la aplicación específica. Por ejemplo, en un timeline de
datos, ya que lo que más importa es mantener la continuidad del Twitter tal vez no sea indispensable que los tweets sean procesa-
flujo. Pensemos en cómo funciona un stream de video: de vez en dos exactamente en el mismo orden en el que fueron generados.
cuando se pierden paquetes de información y baja un poco la
calidad, pero lo importante es que se mantenga el flujo y que no Referencias
tengamos que comenzar desde el inicio. [1] J. Scott. “A Quick Guide to Spark Streaming”. http://swgu.ru/rf

SG.COM.MX 019
¿QUÉ ES UNA
ORGANIZACIÓN DIRIGIDA POR DATOS?
Por DJ Patil y Hilary Mason

Este artículo es un extracto del libro “Data Driven” escrito por DJ Patil y Hilary Mason y publicado por O’Reilly Media.

Las organizaciones más conocidas que requería entender tendencias estaciona- gasolina. Los resultados fueron sorpren-
están dirigidas por datos, son empresas les y diferencias regionales. Conforme dentes, en un año ahorraron alrededor de
nativas de internet como Google, Amazon, aumentó el número de tiendas y volumen 10 millones de galones de gasolina, con-
Facebook y LinkedIn. de productos, también aumentó la com- tribuyendo también así, a disminuir su im-
plejidad de manejar el inventario. Gracias pacto al medio ambiente.
Sin embargo, estar dirigido por datos no a la disponibilidad de datos históricos
está limitado a internet. Walmart ha sido combinados con un modelo predictivo, la De forma similar, General Electric utiliza
pionero en el uso de datos desde los 70. empresa pudo controlar su curva de cre- datos para mejorar la eficiencia de sus
Fue una de las primeras organizaciones en cimiento. Para reducir aún más el tiempo motores de avión. Actualmente hay apro-
construir grandes data warehouses para para que sus datos se convirtieran en de- ximadamente 20 mil aviones operando
gestionar el inventario a través de sus ne- cisiones, Walmart fue la primera empresa con 43 mil motores GE. Durante los próxi-
gocios. Esto la habilitó para convertirse en invertir en tecnología RFID. Y reciente- mos 15 años se espera que se utilicen 30
en la primera empresa en tener más de 1 mente ha puesto sus esfuerzos en tecno- mil motores más. Una mejora en eficiencia
billón de ventas durante sus primeros 17 logías de procesamiento de datos como de 1% resultaría en 30 billones de dólares
años. Y la innovación no terminó ahí. En Hadoop y Cassandra. a través de los próximos 15 años. Parte del
los 80, Walmart se dio cuenta que la cali- esfuerzo para atacar estos problemas es
dad de sus datos no era suficiente, así que FedEx y UPS también son conocidos por el nuevo motor GEnx. Cada motor cuenta
para adquirir mejores datos se convirtió en utilizar datos para competir. Por medio con más de 4 mil partes y pesa cerca de 6
la primera empresa en utilizar lectores de de análisis de datos, UPS se dio cuenta toneladas. Uno de sus principales diferen-
código de barra en las cajas. La empresa que si sus choferes solo daban vueltas ciadores es la cantidad de datos que re-
quería saber qué productos se vendían y hacia la derecha (evitando las vueltas a gistra en tiempo real. De acuerdo con GE,
cómo es que el acomodo de productos en la izquierda) tendrían menos accidentes, en tan solo un vuelo se genera alrededor
la tienda impactaba las ventas. También menos tiempo perdido, y ahorrarían en de un terabyte de datos. Estos datos son

020 SG.50
EN PORTADA
021

documentados, en un formato consistente, éxito de Facebook, y es algo en lo que con-


y libres de errores. Limpiarlos típicamente tinúa invirtiendo agresivamente.
representa 80% de un esfuerzo de ciencia
de datos. Establecer procesos para limpiar Las principales empresas de internet han
datos a grandes escalas agrega mayor seguido el ejemplo de Facebook. Ser ca-
complejidad. Las organizaciones exitosas paz de utilizar SQL para acceder datos
hacen inversiones significativas en herra- es una habilidad esencial para todos los
mientas, procesos y auditorias para maxi- analistas y ejecutivos en empresas como
mizar dicho proceso. Han desarrollado una Google y LinkedIn. Las organizaciones sin
cultura que comprende la importancia de la fines de lucro también están viendo gran-
calidad de los datos. des beneficios de brindar acceso a sus
datos. Se han dado cuenta que expertos
Un número sorprendente de organizacio- fuera de la organización pueden realizar
nes ha invertido cuantiosamente en sus descubrimientos importantes. Por ejem-
capacidades de procesamiento de datos, plo, el Banco Mundial abrió sus datos
con la esperanza de que eventualmente para que grupos de voluntarios puedan
sus empleados generen valor a partir de limpiarlos e interpretarlos. Esto ha ge-
ellos. Esta actitud de tipo “si lo constru- nerado tanto valor que creó un sitio web
yes, eventualmente vendrán” rara vez es dedicado a datos públicos.
exitosa. El resultado son grandes costos
para crear un baúl de datos que rara vez se Los gobiernos también han comenzado a
usa. Las mejores organizaciones utilizan reconocer el valor de democratizar el ac-
sus datos continuamente para entender a ceso a datos, tanto a nivel local como na-
sus clientes y los detalles de su negocio. cional. Por ejemplo, el gobierno del Reino
Hacen experimentos que les permiten Unido ha sido líder en esfuerzos de datos
demostrar hipótesis que mejoran su em- abiertos, y el gobierno de Estados Unidos
presa y procesos; y utilizan los datos para creó la Open Government Initiative para
construir nuevos productos. aprovechar este movimiento. Conforme el
público y el gobierno comenzó a ver el valor
DEMOCRATIZAR LOS DATOS de abrir los datos, los gobiernos empezaron
La democratización de los datos es una de a catalogar sus datos, capacitar al público
las ideas más poderosas que ha surgido de sobre cómo usarlos, y publicarlos de ma-
la ciencia de datos. Todos los miembros de nera que sean fácilmente consumibles con
una organización deberían tener acceso a herramientas. En la ciudad de Nueva York,
utilizados por los pilotos para tomar deci- tantos datos como sea legalmente posible. el acceso a datos llevó a nuevas estrategias
siones que impacten la eficiencia, y por las basadas en analítica, que obtuvo grandes
aerolíneas para optimizar sus rutas y anti- El acceso público a datos se ha populari- resultados, incluyendo una mejora de 5x
cipar problemas de mantenimiento. zado en las ciencias (por ejemplo, algunos en el tiempo que le toma a los inspectores
países dan acceso directo a sus datos del encontrar departamentos ilegales.
¿Qué habilita a estas empresas para utilizar servicio climatológico o de salud). En el
datos para obtener ventaja competitiva? caso de las empresas, Facebook es una de Uno de los retos de la democratización
las primeras organizaciones que dio ac- es el de ayudar a las personas a encon-
Una organización dirigida por datos es ceso general a sus empleados a los datos trar los conjuntos de datos adecuados y
aquella que adquiere, procesa y aprovecha de la empresa sin necesidad de hacer una asegurar que dichos datos son de buena
datos continuamente para crear eficien- petición o esperar autorización. Esta fue calidad. Como ya mencionamos, 80% del
cias, desarrollar o iterar nuevos productos, una idea radical ya que la noción preexis- esfuerzo del científico de datos es prepa-
y navegar el panorama competitivo. tente era que los empleados no sabrían rar los datos, y es probable que la mayoría
cómo acceder a los datos y utilizarían de las personas no cuente con la prepa-
Desmenucemos esta definición... datos incorrectos para tomar decisiones ración adecuada para realizar la limpieza
de negocio incorrectas. Aunque cierta- ellos mismos. Es así que para ayudar a los
El primer paso para trabajar con datos es mente hubo retos que superar, Facebook empleados a utilizar datos de la mejor ma-
poder adquirirlos y procesarlos. Pero no encontró que los beneficios superaban por nera, en algunas organizaciones está sur-
es obvio que es lo que tenemos que hacer mucho a los costos; se convirtió en una giendo el rol del delegado de datos (data
para lograr esto de forma continua. Las empresa más ágil, que rápidamente puede steward). Su responsabilidad es asegurar
mejores organizaciones dirigidas por datos construir nuevos productos y responder a la consistencia y calidad de los datos, y
se enfocan sin cesar en mantener sus da- cambios en el mercado. El acceso a datos gestionar la inversión en herramientas y
tos limpios. Los deben estar organizados, se ha convertido en una parte crítica del procesos para lograr esto.

SG.COM.MX 021
EN PORTADA
022

¿CÓMO PUEDE LA
ANALÍTICA PREDICTIVA AYUDAR A MEJORAR LOS NEGOCIOS?
Por Manuel del Pino

El descubrimiento de información Una creciente cantidad de empresas está y realizar una aproximación más proactiva
interesante siempre es valioso y puede optimizando sus negocios gracias a la y cercana a aquellos con niveles más altos.
ayudar a realizar análisis con relación a monetización de datos y al empleo de la Esto permitirá reducir el índice de fuga,
un incidente. Dicho análisis se produce analítica para tomar mejores decisiones. ahorrar dinero, mejorar la satisfacción del
cuando una organización descubre una Aunque estas organizaciones provienen de cliente y mantener cuota de mercado.
serie de tendencias sobre comporta- numerosas y variopintas industrias, en esta
mientos de sus clientes, como pueden ocasión me gustaría destacar dos áreas Obtenemos conclusiones cuando analiza-
ser los siguientes: en particular: en el ámbito universitario, mos los datos de manera holística, combi-
la relativa al reclutamiento y retención de nando, por ejemplo, aquellos que reflejan
• Clientes que cancelan sus cuentas y estudiantes; y en el segmento sanitario, la las interacciones de los clientes con los
se van a la competencia. relacionada con la calidad de los datos para call centers y las redes sociales, junto a
• Clientes menores de 30 años que mejorar la atención al paciente. Ambos es- datos tradicionales como cuentas, infor-
cuentan con historiales reducidos de cenarios ejemplifican a la perfección cómo mación de gastos y detalles geográficos.
hábitos de compra. la analítica predictiva puede ayudar no solo Pero la analítica que realmente impacta
• Clientes dentro de una horquilla a destapar tendencias ocultas en los da- en el negocio se obtiene, en este caso, tras
determinada de ingresos que han lla- tos, sino también a generar un impacto en vincular esas repetidas llamadas al call
mado al call center tres o más veces la cuenta de resultados. La habilidad para center y los sentimientos negativos verti-
en los últimos seis meses. generar ingresos, reducir costos y mejorar dos en redes sociales con una incidencia
• Clientes desde hace menos de un el servicio ilustra el hecho de que obtener concreta, como la fuga a la competencia.
año cuyos comentarios sobre la em- ideas muchas veces no es suficiente: la
presa reflejan sentimientos negativos. clave estriba en ir más allá. Hoy día ya somos capaces de saber cómo
estos aspectos elevan los costos de una
Sin duda, estas conclusiones resultan in- MÚLTIPLES VARIABLES organización, cómo pueden interactuar
teresantes y posibilitan un conocimiento Las conclusiones que obtenemos con rela- con otras fuentes de información y cómo
más profundo del comportamiento de los ción a la edad de un cliente, su historial de permiten realizar análisis de las causas
clientes, pero para extraer su máximo va- gasto, sus ingresos, las llamadas que rea- y mejorar los procesos. De esta manera
lor deben tener impacto directo en el ne- liza a nuestro call center, su entorno geo- cualquier organización podrá establecer
gocio. Para ello han de permitir predecir el gráfico o las opiniones que ha vertido sobre acciones correctivas para reducir el nú-
comportamiento del cliente en el futuro nuestra organización nos pueden ayudar a mero de llamadas de queja y mejorar el
para poder modificar los procesos y deci- predecir su futura marcha. Podemos asig- engagement que su marca despierta en los
siones de la empresa. nar una probabilidad de fuga a cada cliente distintos canales sociales.

Manuel del Pino es responsable de preventa de Information Builders para México, España y Portugal.

022 SG.50
EN PORTADA
023

CAPITAL DE DATOS Y
ANALÍTICA AVANZADA
Por Jorge Gálvez

Para ser exitosas en la economía di- algoritmos de analíticos avanzados, ha siempre la oportunidad de capturarlos. Así
gital, las empresas deben internalizar la mostrado drásticamente un constante que las empresas deben digitalizar y “da-
idea de que los datos son un nuevo tipo retorno de la inversión. Tradicionalmente, tificar” las actividades clave con clientes y
de capital, tan importante como el capital los centros de datos han sido vistos como proveedores para poder estar capturando
financiero para el desarrollo de nuevos un impuesto o costo más que un genera- esos datos al momento de la actividad.
productos y servicios. dor de dividendos. El costo de mantener
grandes volúmenes de datos es una carga 2. Los datos generan más datos. Los algo-
Las implicaciones de esto van mucho más bastante pesada cuando no es posible sa- ritmos que dirigen las decisiones de pre-
allá de la toma de decisiones por medio de car nuevo valor de los datos y utilizarlos cio, publicidad, inventario o detección de
analítica predictiva. Para algunas empre- para generar acciones de apoyo al nego- fraudes generan datos que a su vez utili-
sas, el capital de datos incluso sustituye al cio, tales como predecir la conducta de zan como retroalimentación para mejorar
capital tradicional. Solo de esta manera se los clientes, entender las causas raíces del su desempeño. Este ciclo de retroalimen-
puede explicar que empresas de servicios comportamiento y reducir los fraudes. tación genera una ventaja competitiva que
digitales tengan valuaciones de miles de es difícil de alcanzar.
millones de dólares. ¿Cómo pueden las compañías convertir
los centros de datos en activos generado- 3. Las plataformas ganarán. En las indus-
Hoy en día, los analíticos avanzados per- res de dividendos? trias intensivas en información, como el
miten a las empresas sacarle el mayor software y el mercado bursátil estamos
provecho a los datos que se producen Una forma es a través de la reducción acostumbrados a que existan plataformas
a partir de las actividades del día a día, del costo de transacción. Típicamente, informativas, ya sea abiertas o dominadas
desde la información generada por senso- estos costos de transacción involucran por una empresa. Este mismo fenómeno
res, por los puntos de venta, llegando a las mover los datos en ambientes donde los se dará en otras industrias conforme usen
redes sociales e imágenes y video. Las he- modelos predictivos pueden producirse datos más y más. En industrias como la
rramientas tradicionales de inteligencia de o el análisis de los datos se realiza sobre automotriz y de servicios de salud vere-
negocio producen un resumen o sumario un subconjunto pequeño de datos que mos que las empresas competirán para
de los datos, generando a su vez más da- puede caber en arquitecturas de hardware convertirse en la plataforma de informa-
tos, pero las herramientas tradicionales de y software existentes. Luego está el costo ción dominante en su industria.
inteligencia de negocio proveen una visión involucrado en poner dichos modelos en
del pasado, es decir, lo que ya sucedió. Los producción. Los costos de transacción CONCLUSIÓN
analíticos avanzados, de la misma forma, resultan en esfuerzos de múltiples pasos Las organizaciones hoy en día deben consi-
producen más datos a partir de los datos que involucran un trabajo intensivo, lo cual derar al científico de datos o, a los analistas
existentes, pero estos datos son transfor- lleva a las compañías a posponer su inver- como “gerentes del capital de datos”. Esto
macionales, creando conocimiento pre- sión en los datos y obtener valor de ellos. es, son las personas encargadas de extraer
viamente desconocido y ofreciendo una el mayor provecho y ganancia de los activos
visión del futuro y de opciones no iden- LEYES DEL CAPITAL DE DATOS de datos. Para alcanzar estos altos dividen-
tificadas previamente, que muy posible- En Oracle identificamos tres leyes funda- dos con costos bajos de las transacciones,
mente sucederán. mentales del capital de datos que des- los gerentes del capital de datos necesitan
cribo a continuación: valerse de herramientas y plataformas que
Las empresas deben de poner a trabajar automaticen las actividades, haciéndolo
a sus datos para poder obtener un re- 1. Los datos provienen de la actividad. Los más productivo y finalmente obteniendo
torno de inversión a partir de la captura, datos son registros de eventos sucedidos, logros más espectaculares para la em-
limpieza y mantenimiento de los mismos. así que si no estamos al tanto de las acti- presa, haciendo más con menos gracias a
Poner a trabajar a los datos a través de vidades cuando suceden, perdemos para la rapidez y sencillez.

Jorge Gálvez es Director de Desarrollo de negocios para Oracle México.

SG.COM.MX 023
EN PORTADA
024

TRANSFORMANDO CON DATOS LA


INDUSTRIA DE MANUFACTURA
Por Miguel Nhuch

Ahora más que nunca, la industria de la y toma mucho tiempo. Debido a que las el poder revisar los datos y ver cosas que
manufactura se enfrenta al reto de reunir mejores implementaciones de análisis no habían visto antes es una gran ventaja.
y comprender cantidades masivas de da- son tableros creados por el usuario, que
tos para impulsar la eficiencia operativa, funcionan sobre una infraestructura admi- La figura 1 muestra un ejemplo de un ta-
un nivel más alto de servicio y soporte. nistrada por IT, la optimización del auto- blero de análisis de producción donde los
Nos guste o no, la manufactura avanza servicio es clave. usuarios pueden explorar el desempeño
cada vez más rápido y la actitud de con- de varias órdenes producidas con dos
formismo ante la situación actual empieza La analítica de autoservicio permite que máquinas distintas (123 y 456). A la iz-
a desvanecerse porque los encargados de los empleados de las plantas de manu- quierda vemos las distintas órdenes grafi-
la toma de decisiones ya no pueden con- factura puedan, al igual que el resto de la cadas de acuerdo a su tamaño y varianza.
tar con los antiguos sistemas de negocios organización, visualizar y comprender los Al seleccionar una de ellas podemos ver
para obtener la información que necesitan. datos a lo largo de la cadena de demanda a la derecha los detalles de dicha orden,
dentro de las operaciones de producción y como el tiempo de configuración y veloci-
En el mercado de hoy, explorar el efecto y durante todo el ciclo de vida del servicio. dad de operación.
la interacción entre la eficacia en la produc- Al añadir visibilidad al desempeño opera-
ción, la calidad de los productos, la demanda tivo, los empleados tendrán la capacidad
de los clientes y la excelencia en el servicio de supervisar los datos a lo largo de toda
simplemente no es posible sin análisis signi- la organización y de aplicarlos para bus-
ficativos. Estas son cuatro de las formas en car mejoras continuas en los negocios y
que los fabricantes están revolucionando su en los procesos por medio de las filosofías
industria por medio de los datos: de Seis Sigma o los principios de produc-
ción sin desperdicios. El autoservicio tam-
1. Mejorar la producción, el desem- bién apoya la implementación del marco
peño de las plantas y los productos DMAIC (Define, Measure, Analyze,
con analítica de autoservicio. Improve, Control) para apoyar el ciclo de
2. Mejorar la planeación de ventas y mejora impulsado por los datos, lo cual Figura 1. Tablero de análisis de producción.
operaciones por medio de combina- permite que un individuo explore e iden-
ción y predicción. tifique la causa original de los defectos en
3. Movilizar la cadena de suministro los productos o los cuellos de botella. MEJORAR LA PLANEACIÓN DE VEN-
con análisis en tiempo real. TAS Y OPERACIONES
4. Escuchar, interpretar y reaccionar más Tesla Motors Designs, un importante fa- Las grandes mejoras en la manufactura
rápido a los comentarios de los clientes. bricante de vehículos eléctricos y com- deben comenzar desde la fuente: la ca-
ponentes de sistemas de transmisión, dena de suministro. Es esencial que todos
MEJORAR EL DESEMPEÑO EN descubrió que los análisis de autoservicio los profesionales de cadenas de suminis-
LAS PLANTAS CON ANALÍTICA DE permitieron a sus empleados explorar sus tro tengan la capacidad de proporcionar
AUTOSERVICIO propios datos y contribuyeron de forma bienes y servicios usando diferentes siste-
Tradicionalmente, las personas que es- importante a sus descubrimientos acerca mas de información en plazos muy cortos.
tán dentro de la manufactura han obte- de la mejora y la estabilización de la pro-
nido acceso al conocimiento de los datos ducción. De acuerdo con sus ingenieros Los fabricantes de hoy se enfrentan a mu-
mediante informes estáticos de aplica- de prueba, cuando las personas empiezan chas fuentes de datos: la planeación de
ciones empresariales y herramientas de a tener acceso a los datos, comienzan a la fuerza laboral y los pedidos desde el
inteligencia empresarial que únicamente hacer más preguntas; y ahí está la capaci- sistema de planeación de recursos em-
administra y usa el departamento de dad de ir más allá. Cuando los ingenieros presariales (ERP), la información de los
Tecnología de la Información. Esta cos- de Tesla están tratando de encontrar la pedidos desde los sistemas de ejecución
tumbre antigua, diseñada y desarrollada causa original de algún problema molesto de manufactura (MES), las bitácoras de
principalmente durante la década de los que ha estado afectando la producción de tiempo y asistencia, los datos de alarmas
90, generalmente es compleja, inflexible forma negativa durante semanas o meses, y producción de diferentes fabricantes de

Miguel Nhuch es Vicepresidente de Tableau Latinoamérica.

024 SG.50
equipo y varios sistemas de control de lí- de Coca-Cola más grande de Estados Trane, líder global en sistemas y equipo
nea de producción (PLC) y de control de Unidos, tiene trabajadores en el campo de aire acondicionado, pasó de usar
sistemas y adquisición de datos (SCADA). que interactúan y colaboran con ta- únicamente hojas de cálculo a integrar
Vincular estas islas de información es bleros visuales desde cualquier lugar; visualizaciones de datos de autoser-
clave para comprender el panorama y la incluso los choferes de camiones en di- vicio con los datos de servicio de los
toma de decisiones. ferentes ciudades. CCBCC resolvió un clientes para mejorar de manera signi-
cuello de botella enorme en su cadena ficativa su velocidad de comprensión.
MOVILIZAR LA CADENA DE SUMINIS- de suministro, debido a la disponibilidad Los tiempos de entrega a partir del
TRO CON ANÁLISIS EN TIEMPO REAL limitada de informes, proporcionando entendimiento de los datos hasta la sa-
La capacidad de ver y comprender lo que actualizaciones diarias del tablero en tisfacción del cliente son ahora de 10 a
sucede con datos en tiempo real y desde dispositivos móviles a los líderes y a más 100 veces menores.
un dispositivo móvil es aún más revolu- de 800 empleados.
cionaria en las operaciones de cadenas Con la visualización de datos, Trane da
de suministro. Los datos de manufactura REACCIONAR MÁS RÁPIDO A LOS seguimiento a las métricas clave para re-
cambian constantemente, pero son re- COMENTARIOS DE LOS CLIENTES gistrar los comentarios de los clientes más
levantes de manera inmediata. Usar los Después de todo, los deseos y las ne- rápido. Tienen la capacidad de explorar
datos en el momento correcto es esencial cesidades del cliente importan. Los fa- sus datos para encontrar respuestas, por
para una operación más provechosa. bricantes tienen que reunir los datos de ejemplo, ¿los técnicos llegan puntuales en
los clientes mediante muchos canales una región determinada?
La buena noticia es que el BI móvil está diferentes, como las redes sociales, los
ofreciendo información en el momento y centros de atención telefónica y las en- Los empleados de ventas, los empleados
lugar necesarios para tomar decisiones cuestas de los clientes. Cuando se llega de manufactura y los ejecutivos pueden
cruciales de manera rápida. Coca-Cola a comprender algo gracias a la informa- ver rápidamente los distritos con mejor y
Bottling Co. Consolidated (CCBCC), la ción de los clientes, es fundamental ac- peor desempeño, así como buscar la razón
empresa embotelladora independiente tuar rápido. en los datos subyacentes.

SG.COM.MX 025
EL RAZONAMIENTO DETRÁS DEL
LAGO DE DATOS EMPRESARIAL
Por Pedro Galván

Uno de los conceptos que ha surgido en En el presente artículo explicamos la ne- negocio. Los departamentos de TI deben
los últimos años en el ámbito de gestión de cesidad y razonamiento detrás de los la- darse cuenta que no lograrán cumplir sus
información empresarial es el “lago de datos” gos de datos. ambiciones de centralizar bajo su control
(data lake). En principio hay quienes podrían toda la información de la empresa. El lago
pensar que el lago de datos es simplemente Peter Drucker utilizaba la expresión “la cul- de datos atiende este reto por medio de la
una nueva forma de presentar el data ware- tura se come a la estrategia de desayuno” construcción de una cultura unificada ha-
house y que en realidad no hay nada nuevo para resaltar que lo más dificil de cambiar cia los datos que permita enfocarse en las
bajo el sol. Sin embargo, esto no es correcto. en una organización es su cultura. A pesar áreas que generan verdadero valor.
de esto, en el ámbito de gestión y análisis de
Es cierto que al igual que un data ware- información los departamentos de TI tienen LA CULTURA DE INFORMACIÓN
house, un data lake es un repositorio de décadas luchando contra una cultura de DEL NEGOCIO
información empresarial. Sin embargo, la di- negocio que no pueden cambiar. Mientras Una empresa típicamente está organizada
ferencia es que un data warehouse contiene los departamentos de TI siguen buscando como un conjunto de departamentos, re-
información altamente estructurada, que se forzar a las áreas de negocio a utilizar un giones o verticales, cada una con su pro-
carga de acuerdo a un modelo previamente data warehouse centralizado, las áreas de pia estructura y métricas. La cultura de
definido y acordado; es decir, la estructura y negocio continúan usando hojas de cálculo información en cada una de estas áreas
requerimientos de información se definen y bases de datos departamentales. consiste en utilizar vistas locales de infor-
previo a que ésta se cargue (schema on- mación, desplegadas y analizadas en un
write). Por otro lado, el data lake contiene El concepto del lago de datos busca resolver contexto local.
información en su estado nativo, que puede este desafío por medio del uso de tecnolo-
ser estructurada o no estructurada, y el con- gías de big data (por ejemplo Hadoop) para Incluso a nivel corporativo la intención es
sumidor de la información le da la forma disminuir las restricciones de costo en alma- tener vistas localizadas y restringidas a los
que necesita para un propósito específico cenamiento y movimiento, al mismo tiempo intereses corporativos. Esta cultura fomenta
cuando la accede (schema-on-read); así que que provee a las áreas de negocio la flexibili- el uso de soluciones puntuales y dificulta la
un mismo conjunto de datos, que reside en dad y agilidad que requieren. gobernanza horizontal. Si algo le funciona
su forma nativa en un lago de datos, puede a un área, entonces hay menos motivación
ser moldeado de distintas formas para aten- El lago de datos no es simplemente una para habilitar una vista horizontal.
der distintas necesidades. Esto hace que los iniciativa tecnológica. Consiste principal-
lagos de datos sean mucho más flexibles y mente en cambiar la cultura de TI para LA CULTURA DE INFORMACIÓN DE TI
ágiles que los data warehouse tradicionales. ser más compatible con la de las áreas de En contraste, los departamentos de TI

Pedro Galván Kondo es cofundador y director editorial de SG Software Guru.

026 SG.50
EN PORTADA
027

históricamente han buscado estable- unidades de negocio es complejo, tecnología disponible. Las nuevas tecnolo-
cer una solución de tipo “una talla para largo y en algunos casos no deseable. gías pueden reducir significativamente el
todos”; es decir, el data warehouse em- • Al lidiar con información externa es costo de almacenamiento, habilitar analí-
presarial. La meta es simple: tener toda muy poca la capacidad que tenemos tica en tiempo real y proveer información;
la información empresarial en un mismo de estandarizar. y permitir a los usuarios utilizar fuentes de
lugar de manera que el modelado carga y datos diversas.
gobernanza se haga una vez y ya. Para resolver dicha problemática los depar-
tamentos de TI tienden a apoyarse en proce- Son estos desafíos de negocio y avances
Esta vista centralizada busca dar al negocio sos y herramientas ETL (Extract, Transform, tecnológicos los que han llevado a un
lo que sea que necesite y proveer un punto Load). El dilema es que esto es un meca- nuevo tipo de solución y metodología:
único a donde todos los usuarios puedan ir nismo de “mínimo común denominador”, el lago de datos. Estrategia basada en la
para obtener información. Esta cultura pro- en el cual se extrae la mínima información noción de no estorbar la operación del
mueve la centralización con el afán de maxi- posible que satisface el esquema y mantiene negocio y fomentar una nueva cultura de
mizar el control y la eficiencia de costo. la consistencia; así es, la prioridad es la con- información donde se aproveche la cultura
sistencia, no el valor a las áreas de negocio. de información en las áreas de negocio, en
Esta cultura se resume en unos cuantos lugar de combatirla.
principios: El razonamiento principal para dicha es-
1. Hay una sola vista para cualquier trategia es la reducción de costos, ya que CONCLUSIÓN
dato: la forma canónica. al tener una sola vista de la información, TI El paradigma del lago de datos se basa en
2. Sólo se deben mover los puede minimizar el costo de administrarla. los siguientes principios:
datos requeridos. Sin embargo, dado que esto no resuelve 1. Capturar toda la información
3. Empujar a todo el negocio hacia la las necesidades de las áreas de negocio, posible en su estado natural, sin
vista única de información. el resultado es que éstas construyen sus modificaciones.
4. Prevenir bases de datos locales. propias bases de datos y soluciones para 2. Fomentar que las áreas de negocio
explotarlas. Continúan alimentando al construyan soluciones puntuales.
La mayoría de los data warehouse empre- data warehouse corporativo con el mí- 3. Permitir que las áreas de negocio
sariales han sido diseñados utilizando una nimo de información acordada, pero en decidan la relación costo/desempeño
capa central modelada bajo la 3era forma realidad no lo usan como fuente de datos. de su solución.
normal (forma canónica). En teoría, esta 4. Concentrar la gobernanza solo en
capa debería ser alimentada por todas las NUEVOS DESAFÍOS los puntos requeridos.
fuentes de datos (internas y externas) y a su El acercamiento previamente descrito está 5. Considerar la vista corporativa como
vez debería ser la fuente de cualquier data basado en las necesidades de hace 30 si fuera una vista departamental más.
mart o mecanismo de explotación de datos. años, que para el ritmo al que evoluciona 6. La información no estructurada si-
TI es toda una eternidad. Actualmente hay gue siendo información.
Esta capa da fuerza a una forma de tra- mucho más preguntas alrededor de los 7. Asumir que el lago contiene todo.
bajo de “una versión única de la verdad”. datos que requieren respuesta: 8. La escala es dirigida por la de-
Cualquier información puesta en el ware- manda que es elástica (se puede ex-
house debe definirse de forma estricta y • ¿Cómo manejamos los datos pandir o contraer).
precisa, siguiendo procesos y aprobacio- no estructurados?
nes tanto de áreas de negocio como de TI. • ¿Cómo enlazamos datos internos Es en estos principios que se basa la nueva
Típicamente es un consenso, lo cual im- y externos? forma de gestionar el repositorio de datos
plica que nadie obtiene justo lo que quiere • ¿Cómo podemos adaptarnos a la empresarial. Es un nuevo paradigma que
y hay un balance de infelicidad. velocidad que requiere el negocio? promete entregar lo mejor de dos mun-
• ¿Cómo eliminamos el repetitivo dos: permitir que las áreas de negocio
En organizaciones con una operación sen- proceso de ETL? tengan la flexibilidad y riqueza de informa-
cilla o con mucha homogeneidad entre sus • ¿Cómo soportamos distintos ción que buscan, de una forma integrada y
unidades, esto es posible, pero en organi- niveles de calidad y gobernanza de con bajo costo de propiedad.
zaciones más complejas tendemos a en- datos en base a distintas necesidades
contrar los siguientes problemas: de negocio?
• ¿Cómo dejamos que las distintas uni-
• El tiempo requerido para agregar dades de negocio tomen la iniciativa?
nuevos tipos de datos o actualizar • ¿Cómo aseguramos que la plata-
procesos o métricas existentes es de- forma será adoptada?
masiado largo como para satisfacer Referencias
las necesidades del negocio. Aunado a esto, en los últimos 30 años [1] “The Principles of the Business Data Lake”. Capgemini &
• Alinear los procesos de todas las ha habido un cambio dramático en la Pivotal, 2013

SG.COM.MX 027
CUATRO RAZONES POR LAS QUE FALLAN
LOS PROYECTOS DE ANALÍTICA
Por Paige Roberts

Recientemente impartí una conferencia con un colega en la CARENCIA DE UN CASO DE NEGOCIO


que mencionó que 60% de los proyectos de big data fracasaban. El principal problema que he encontrado en proyectos de Hadoop
Inmediatamente los participantes nos preguntaron cuáles eran en los últimos años, es considerar que implementar una plata-
las principales razones. Conforme más y más organizaciones forma de analítica es un fin por sí mismo. Uno de mis pasatiem-
buscan extraer valor de sus datos y se embarcan en iniciativas de pos es el tiro con arco, así que me queda muy claro que para dar
analítica, es importante conocer cuáles son las principales fallas en el centro primero necesito tener un objetivo.
por las que pueden fallar estos proyectos. A continuación com-
parto las cuatro razones más comunes por las que he encontrado Si no entendemos cuál es el dolor de la organización que busca-
que fallan los proyectos de analítica mos remediar, simplemente estaremos haciendo un experimento

Paige Roberts es Product Manager para la línea de Big Data en la empresa Syncsort. Previamente fue consultora en Hortonworks y evangelista técnica en Actian.

028 SG.50
EN PORTADA
029

sin sentido. Sin un problema en mente, el proyecto no tendrá di- mencionamos antes, es probable que no se entienda el ob-
rección y por lo tanto el criterio de éxito no estará definido. Ante jetivo, es poco probable que haya alguna persona o equipo
esto, la probabilidad de que dicho proyecto sea considerado un interesada en heredar el proyecto.
éxito es prácticamente nula.
¿PERO EN REALIDAD FRACASARON?
EXPECTATIVAS IRREALES Aunque he hablado de las razones más comunes por las que
La situación opuesta al problema previamente descrito es po- creo que los proyectos de big data fallan, todos los que tene-
nerse metas irreales, tirarle a las estrellas. La maquinaría de pro- mos experiencia en esto sabemos que en realidad los proyec-
moción de big data está a todo lo que da, pareciera que el big tos no pueden solo clasificarse en éxito rotundo o completo
data puede duplicar nuestras ganancias, ahorrar millones, curar fracaso. Continuando con la analogía del tiro con arco, re-
el cáncer, salvar a las ballenas y hasta sacarle esa difícil mancha cordemos que al hacerlo típicamente tiramos varias flechas
a nuestra camisa. Ante este tipo de expectativas, cualquier pro- hacia el mismo objetivo. Difícilmente daremos en el centro la
yecto se quedaría corto. Incluso proyectos que en otro contexto primera vez, pero cada tiro nos sirve para entender y ajustar,
serían considerados exitosos, serían vistos como fracasos si no buscando que el siguiente tiro sea mejor. Por ejemplo, po-
cumplen todo lo que esperamos del big data. siblemente nos demos cuenta que el viento está afectando
nuestro tiro y necesitamos compensar.
Existe otra variación de esta situación, y es cuando todas las per-
sonas involucradas en el proyecto tienen una expectativa distinta Recientemente apoyé al equipo de servicios profesionales de
del valor que se obtendrá con el proyecto. En este caso, no hay Hortonworks en un proyecto bastante grande de implementa-
un objetivo, hay una docena, en direcciones distintas. Tal vez el ción de Hadoop. Al integrarme al proyecto, éste se encontraba
CMO espera un gran aumento en la efectividad de las campañas en una situación complicada y distaba mucho de lograr las me-
de marketing, mientras el CFO espera un gran aumento en ventas, tas originales. Platicando con uno de los integrantes del equipo
mientras el CIO espera un recorte en costos de infraestructura. con mayor experiencia, me comentó que en realidad él nunca
Todos esperan que el proyecto impacte su área del negocio. No había visto un proyecto que fracasara por completo. Incluso si
manejar bien las expectativas tiende a resultar en un “alcance in- no se logran las expectativas irreales de un proyecto, el nego-
finito” (scope creep). Si intentamos hacer demasiadas cosas, no cio siempre obtiene algún beneficio. Si no se logra encontrar a
lograremos tener éxito en ninguna. la gente adecuada, el personal interno aprenderá y desarrollará
nuevas habilidades. Si no tenían una meta clara, experimenta-
ESCASEZ DE HABILIDADES rían hasta encontrar algo de utilidad a la empresa. En resumen,
Aun si tienes un solo objetivo, y este es claro y alcanzable, no esta persona nunca se había encontrado con una empresa que
lo lograremos si no tenemos personal con los conocimientos y no obtuviera ningún valor de una implementación de Hadoop.
habilidades adecuadas. Una característica esencial de la ana- Platicando con otros miembros del equipo me encontré con
lítica de big data es que es algo que no se puede hacer con perspectivas similares.
herramientas y tecnologías tradicionales. Hadoop y su ecosis-
tema de software está madurando rápidamente, pero todavía Lo que me hace preguntarme, ¿qué tanto de ese 60% de
no es del todo amigable. Una implementación no trivial típi- proyectos fallidos de big data realmente fueron un fracaso?,
camente requiere integrar por lo menos 20 componentes de ¿cuántos fallaron en conseguir su propósito original, pero aún
software distintos, cada uno con sus particularidades de pro- así consiguieron generar valor mayor a su costo? No tengo la
gramación, diseño e integración. Y eso sin tomar en cuenta los respuesta a dicha pregunta, pero si tú estás en una organiza-
detalles de gestionar adecuadamente un clúster de cómputo. ción que “fracasó” en un proyecto de big data, te recomiendo
Lograr ensamblar este rompecabezas de hardware y software la consideres.
requiere habilidades y experiencia.
La versión original de este artículo se encuentra publicada en inglés en
FALTA DE CONTINUIDAD http://bigdatapage.com/
Implementar un proyecto de analítica de big data que sea four-reasons-why-big-data-analytics-projects-fail-or-do-they/
útil y valioso requiere no solo un objetivo razonable y las
habilidades necesarias, sino también tiempo. Por una u otra
razón, me he encontrado con que los patrocinadores (cham-
pion) de los proyectos de big data dentro de una organiza-
ción tienden a moverse con frecuencia ya sea dentro o fuera
de la empresa antes de que los proyectos lleguen a un es-
tado maduro y que demuestre valor. Digamos que es común
que los proyectos de big data queden “huérfanos” antes de
ser adultos. Dado que son proyectos complejos, y como ya

SG.COM.MX 029
P DATOS

Resolviendo Dilemas en un
Pipeline de Data Science

Por Blanca Vargas, Andrés Arteaga, y Eduardo Flores

Al iniciar un proyecto de Data Science se tienen que tomar embargo, a medida que transcurren los días no es raro que se pre-
diversas decisiones para que cada etapa del flujo de trabajo o pi- senten las siguientes situaciones:
peline cumpla con las metas especificadas. El pipeline que defina-
mos depende de factores tales como la experiencia que se tiene • Nos damos cuenta de que no tenemos toda la información
con las plataformas, herramientas, lenguajes o algoritmos espe- que se definió en un principio.
cíficos así como de la investigación previa y referencias externas. • Necesitamos información adicional.
Lo ideal es lograr un equilibrio entre la rapidez que nos brinda el • No tenemos acceso a todas las fuentes.
uso de los elementos conocidos y la incorporación de herramien-
tas y conocimiento nuevo que permita lograr resultados de forma Es recomendable resolver estas cuestiones lo antes posible.
más rápida y eficiente. En este artículo abordaremos algunos di- Aunque sabemos que nos encontramos en un proceso iterativo
lemas a los que generalmente nos enfrentamos en la definición en el cual es posible que hagamos pruebas con datos diferentes a
de un pipeline y en nuestra experiencia, qué aspectos debemos los originales, es mejor tener un conjunto de datos base.
considerar para tomar la mejor decisión.
Una situación común es que cuando el proyecto ya se encuentra
Aunque las etapas de un pipeline están muy definidas, todas es- avanzado se descubren nuevos datos que podrían ser útiles al
tán ligadas a un objetivo. Y es precisamente la ausencia de un modelo. Incorporar nuevos datos podría mejorar el resultado pero
objetivo claro una de las principales causas de los problemas. retrasaría el tiempo de entrega, ¿qué hacer? Esta es una decisión
Para definir ese objetivo debemos cuestionarnos aspectos como: de gestión de proyecto más que nada y podrá variar dependiendo
¿cuál es el resultado tangible esperado del proyecto?, ¿cuáles son del contexto particular. Sin embargo, nuestra recomendación es
los beneficios que generaría el proyecto en caso de ser exitoso?, guiarse por los lineamientos del desarrollo iterativo, terminando la
¿a quién van dirigidos los resultados? La claridad con la que po- iteración actual con los datos que se tenían contemplados al inicio
damos responder a estas preguntas es fundamental para reducir de dicha iteración, y evaluar si tiene sentido incorporar los nuevos
los contratiempos que invariablemente surgirán. datos en iteraciones posteriores. Siempre debemos tener en cuenta
que al final del proyecto es preferible tener un modelo útil aunque
A lo largo del proyecto nos encontraremos con diversas disyun- lleve más tiempo, que terminar a tiempo con un modelo inútil.
tivas que nos obligarán a tomar decisiones. Es conveniente re-
flexionar antes de tomar una decisión impulsiva que haga que ese No tengamos falsas expectativas, el caso ideal en el cual tene-
proyecto fascinante, divertido y retador se transforme en nuestra mos desde el inicio todos los datos perfectos y completos es so-
peor némesis. A continuación se describen algunos dilemas co- lamente una ilusión.
munes a los que nos hemos enfrentado y que se asocian a las
diversas etapas de un pipeline. EXPLORACIÓN Y ENTENDIMIENTO
Cuando existen tiempos reducidos podemos tener la tentación
ADQUISICIÓN de omitir pasos, especialmente en la fase de exploración. A fin
Cuando inicia un proyecto, uno de los primeros puntos a tratar de cuentas, confiamos en las fuentes, ¿qué podría pasar? Aun
es, ¿qué información necesitamos para lograr los mejores resul- cuando tengamos datos muy limpios, es necesario asegurarse
tados? En las reuniones iniciales generalmente se hacen acuer- de que no contienen información que nos pueda llevar a resulta-
dos sobre la información a utilizar y sus respectivas fuentes. Sin dos erróneos. Por ejemplo, podemos encontrar rangos de edades

Blanca Vargas, Andrés Arteaga y Eduardo Flores forman parte del equipo de Innovación y Desarrollo en OCC Mundial. Blanca se desempeña como Data Scientist, Andrés como Data
Engineer y Eduardo como Gerente de Desarrollo e Innovación.

030 SG.50
irreales y ciudades que no existen, entre otros posibles hallazgos que si no los
notamos a tiempo nos harán padecer en fases posteriores. Llevar a cabo la
exploración no debe ser un dilema, debe ser un paso riguroso antes de seguir
con el proyecto.

Pero explorar los datos no lo es todo. Debemos estar seguros de que en-
tendemos cada variable o atributo. Si contamos con un diccionario de da-
tos la labor se facilita pero si no contamos con él, vale la pena no suponer
nada e investigar con el administrador de base de datos de su preferencia
sobre el significado de los datos. No hacerlo puede tener un costo elevado.

PRE-PROCESO, TRANSFORMACIÓN, MANIPULACIÓN


Esta fase requiere que tomemos decisiones con respecto a las transforma-
ciones que nos convienen para obtener los mejores resultados. Es necesario
conocer bien los datos: ¿de qué tipo son?, ¿qué efecto tienen estos tipos en
las transformaciones? Existen detalles sutiles que no deben dejarse para des-
pués. No es lo mismo una variable tipo fecha que una variable numérica; no
es lo mismo una variable tipo factor que una tipo texto. Aunque visualmente
se vean iguales, si no damos a las variables el formato adecuado podemos
consumir tiempo valioso.

En cuanto a los valores atípicos (outliers), también nos enfrentamos a dile-


mas: ¿los quitamos?, ¿los dejamos?, ¿cuáles son las consecuencias de estas
decisiones? Como consideraciones generales podemos decir que si los valo-
res atípicos tienen significado, no se deben eliminar. Si por el contrario, valo-
res atípicos distorsionan la realidad entonces deben eliminarse. Imaginemos
que estamos obteniendo perfiles de usuario para ciertos productos. Si intro-
ducimos edades negativas o mayores de 200 años los modelos resultantes
mostrarán patrones de usuarios inexistentes. Por supuesto, hay diversas si-
tuaciones y tratamientos que pueden darse a valores atípicos. El punto clave
es que no debe restarse importancia a las decisiones sobre estos valores.

ANÁLISIS Y MODELADO
Ya que nuestros datos están preparados y listos, la pregunta es ¿qué tipo de
análisis necesito? Esto depende fundamentalmente del objetivo del análisis.
Existen infinidad de técnicas y algoritmos que pueden ser útiles ya sea como
base o bien podemos diseñar un nuevo algoritmo ad-hoc a nuestro problema.
En cualquier caso, la decisión de la técnica o algoritmo a aplicar tiene su ori-
gen en el objetivo. Y si no tenemos claro el objetivo es muy difícil esperar
tener buenos resultados.

Un problema frecuente es que podemos caer en la tentación de querer


aplicar algoritmos o técnicas emergentes y creer que si no lo hacemos
no somos competitivos. Por ejemplo, ¿de verdad Deep Learning es la so-
lución a nuestro problema? Tenemos que encontrar argumentos sólidos
para tomar decisiones de este tipo. Una estrategia útil es empezar por
la solución más simple e ir incrementando el nivel de sofisticación de la
solución en la medida que lo requiera el proyecto, no en la medida de
nuestro ego.
P DATOS

COMUNICACIÓN Y OPERACIÓN trabajo pesado? ¿utilizar cómputo en la nube para el procesa-


Y llegamos a la fase en la que ya tenemos resultados buenos. ¡Si, miento, y si es así, cómo hacer segura la información privada que
lo logramos! Después de varias iteraciones en las fases anteriores saldrá de nuestros servidores?
hemos llegado a la parte de presentar los resultados. La interro-
gante es: ¿cómo presentarlos?, la respuesta depende de diversos Durante la fase de diseño del sistema, uno de los primeros dile-
factores: ¿el resultado es un reporte?, ¿es un producto?, ¿es un mas que se pueden encontrar en las implementaciones es el tipo
servicio?, ¿es un dashboard?, ¿es un resultado final o una itera- de arquitectura en la que va a correr. En mayor parte se cuenta
ción?, ¿para quién son? con dos opciones: utilizar la infraestructura local o utilizar las di-
ferentes servicios que ofrecen procesamiento en la nube. En este
Aunque estemos muy felices con nuestros resultados, una pre- caso es muy importante conocer las ventajas y desventajas que
sentación inadecuada puede ser desastrosa si no mostramos los cada una de estas implementaciones ofrece, además de las nece-
aspectos de interés para cada público. Es conveniente elaborar sidades propias del sistema a implementar y que pueden afectar
dos presentaciones base: en menor o mayor medida a la decisión que vamos a tomar.

• Presentación técnica: debe incluir detalles de análisis e Lo primero que tenemos que tomar en cuenta es la capacidad de
implementación para que sea reproducible. Debe incluir re- procesamiento necesaria para la implementación de nuestra so-
ferencias a los repositorios donde se ubica el proyecto para lución de data science, de esta manera podemos estimar si los
que los interesados puedan repetir los experimentos y aná- servidores propios son lo suficientemente capaces para soportar
lisis. En este tipo de presentación es importante contestar la la carga extra que vamos a agregar al nivel de trabajo diario. En
pregunta: ¿cómo se obtuvieron los resultados? caso de que el procesamiento no sea factor, se debe de tomar en
cuenta la cuestión monetaria ya que las soluciones en la nube
• Presentación no técnica: debe omitir detalles de análisis involucran un gasto que comienza siendo moderado pero rápida-
e implementación e incluir resultados duros y cómo aplicar mente puede llegar a cifras altas dependiendo de las instancias
esos resultados para lograr el objetivo del negocio. Este obje- que necesitemos crear y el tiempo que las tengamos operando.
tivo puede traducirse en beneficios económicos, incremento
en ventas, campañas de marketing, incremento en número de Además de las barreras económicas y de procesamiento, existen
usuarios, entre otros. La pregunta a responder es: ¿qué be- requerimientos específicos del sistema. En este caso si se elige
neficio se obtiene con esos resultados?. En este tipo de pre- una implementación de cloud, es necesario prever la integración
sentación se debe ser cuidadoso en no utilizar tecnicismos a necesaria con el sistema que tenemos local. Necesitamos saber si
menos que sea estrictamente necesario. Es nuestra respon- es necesaria la replicación de información almacenada en bases
sabilidad describir las cosas de modo que esté al alcance de de datos locales y que se tendrá que estar replicando de manera
profesionales de diversas áreas. Y eso no es una tarea trivial. constante a la solución en la nube, además de otros aspectos
como la cantidad de información que será transferida desde el
DILEMAS TÉCNICOS ambiente local a la nube y viceversa.
La implementación de un producto basado en análisis de datos
masivos provoca retos interesantes a resolver dado que los sis- Si por otra parte se opta por una implementación local, es necesario
temas productivos generalmente no están diseñados para el tipo prever desde un principio la necesidad futura ya que si es necesa-
de carga que implica. Por ejemplo, una base de datos que soporta rio escalar la implementación y no se cuenta con la infraestructura
una aplicación web de alta escalabilidad puede responder ade- necesaria para hacerlo es posible que se requiera una reimplemen-
cuadamente cuando se tienen millones de peticiones concurren- tación del sistema. Esta decisión puede llevar al consumo de tiempo
tes pero cuando se necesita consultar para análisis de datos o y recursos que se pudieran haber invertido en otro tipo de solución.
para un producto basado en Big Data puede poner en riesgo los
sistemas productivos. ¿Qué hacer entonces?, ¿Implementar una CONCLUSIÓN
solución batch/offline sacrificando posible utilidad de una solu- Un proyecto de data science representa un reto en distintos niveles y
ción en tiempo real para el usuario?, ¿replicar la base de datos los cuestionamientos son inevitables en el transcurso de las diversas
a otra de sólo lectura o con fines exclusivos para el producto de etapas del mismo. Sin embargo, por sobre cualquier aspecto técnico
data science?, ¿pagar una nueva instancia en caso de bases de está el factor humano. La colaboración, capacidad, motivación y
datos comerciales o escoger una alternativa abierta? ¿exportar buena disposición de los miembros del equipo son los factores clave
simplemente a archivos de texto y dejar que los scripts hagan el que determinarán si el proyecto tendrá éxito o no.

032 SG.50
SG.COM.MX 033
P UX

Cómo Iniciar
Tu Carrera en UX Design —
Por Misael León

Aunque el User Experience (UX) se ha convertido en un término El siguiente paso es generar una idea básica y un prototipo inicial,
popular en nuestra industria, siento que todavía hay confusión y validarlo con usuarios para asegurar que la solución propuesta
sobre la verdadera aportación que un UX designer puede hacer a es la ideal.
un equipo. Esto ocasiona que diseñadores gráficos y web designers
que desean hacer una transición a UX Designers no tengan claro Los prototipos pueden variar en fidelidad desde hechos a
cómo hacerlo. La abundante información que existe en internet ter- papel y lápiz a hasta prototipos de alta fidelidad. El artículo “4
mina creando más confusión todavía. ¿Por dónde comenzar? Actividades UX Para Resolver Controversias de Desarrollo”[1]
provee una guía para determinar cuándo usar cada nivel de
En este artículo intento esclarecer la confusión y darte algunas fidelidad y qué herramienta utilizar. Cabe mencionar que el UX
recomendaciones básicas para iniciar tu propia carrera en UX. Designer no necesariamente produce el diseño final de la inter-
face visual, ese es el trabajo de un Visual Designer si lo existe.
UN UX DESIGNER ES UN FACILITADOR De otra manera puede generar un estilo básico y los wireframes
Básicamente un UX Designer es el intermediario entre el usua- correspondientes para guiar al equipo a través de la evolución
rio y la organización. Su responsabilidad es facilitar que todos los de la solución.
involucrados en el desarrollo de producto o servicio entiendan el
problema real que se está resolviendo. DISEÑA TU PROPIA CARRERA
Todos los UX Designers que conozco hemos pasado por la
Para esto es necesario conocer primero la audiencia, su estilo de misma situación. Todos hemos sentido la ansiedad que provoca
vida, sus frustraciones, sus hábitos de tecnología, y el contexto en cuestionar nuestro propio proceso de diseño. De repente ya no
el que el producto será utilizado. El UX Designer organiza activi- es suficiente crear una pieza visual que sea atractiva y que cum-
dades de investigación para generar este conocimiento. Pero no pla con los requerimientos que te fueron dados. Uno comienza
lo hace en solitario, debe incluir al equipo desde el inicio. a hacerse preguntas.

Misael León (@misaello) es UX Design Researcher en Nearsoft, Inc. una empresa de cultura democrática que desarrolla software y produce clientes felices. Es colaborador del UX Clinic,
una iniciativa dedicada a difundir las mejores prácticas de UX. Es fanático de los libros, el cine, los chocolates. Promotor de la filosofía del asombro.

034 SG.50
UX
P

Si te está consumiendo la angustia de no saber si tu solución es Este mentor te proveerá literatura útil, autores, libros, pláticas
realmente efectiva, creo que estás listo para hacer la transición. Un online, referencias, etc. Pero lo hará de manera ordenada depen-
UX Designer crea la mejor solución posible pero también levanta diendo de tus inquietudes reales.
los requerimientos, entiende el problema y valida la solución.
Descubrirás con el tiempo que el campo de UX es también muy
Me gusta aplicar esta analogía: Si quieren que prepares la comida, amplio. Ahí creo que radica la parálisis inicial. En la abundante
pide que te dejen escoger los ingredientes e ir a comprarlos también. información y no saber por dónde comenzar. Un mentor te ayu-
dará a disminuir esa ansiedad.
No tengas miedo a dar el salto. No significa que ya no utilizarás
todo lo aprendido en tu carrera de diseñador. Significa que ten- SÉ AUTODIDACTA
drás a tu disposición una serie de metodologías de investigación En una industria que está en constante cambio es primordial estar
e ideación de soluciones. Serás como una navaja suiza del diseño. al tanto de las tendencias. Tus únicas opciones son leer y hacer.
Recuerda que tienes más control sobre tu propia carrera profesio-
nal de lo que crees. Es cuestión que te decidas. Cinco libros que te ayudarán a poner tu cabeza en el lugar
correcto:
Ok, ¿pero cómo hacerlo? 1. The Design of Everyday Things, de Don Norman.
2. The Elements of User Experience, de Jesse James Garrett.
HAZTE VISIBLE EN INTERNET 3. Change By Design, de Tim Brown.
Comienza a seguir UX Designers nacionales y de otros países. 4. Don’t Make Me Think, de Steve Krug.
Hay también distintos grupos que constantemente comparten 5. 100 Things Every Designer Needs to Know About People, de
artículos y literatura útil. Aquí algunas referencias: Susan Weinschenk.
• UX Booth - http://www.uxbooth.com
• UX Matters - http://www.uxmatters.com Al final lo importante es que des rienda suelta a tu curiosidad. Irás
• UX Magazine - http://uxmag.com descubriendo pistas. Síguelas y escucha a tu mentor.
• UX Pin - https://twitter.com/uxpin
• UX Links - https://twitter.com/uxlinks Es altamente recomendable que lo que vayas aprendiendo en teo-
• UX LLC - https://twitter.com/ux ría también lo apliques en la práctica. Puede ser en algún proyecto
• Usability Tools - https://twitter.com/UsabilityTools personal en el que estés trabajando actualmente. Por ejemplo,
• Ideo - https://twitter.com/ideo jala a tus conocidos y realiza con ellos una prueba de usabilidad o
• User Interface Engineering - http://www.uie.com sal a la calle a platicar con gente que podría utilizar tu producto.
• Norman Nielsen Group - http://www.nngroup.com/articles Valida tus supuestos con gente real.
• Nearsoft - http://nearsoft.com/blog/category/design-ux
• Jared Spool - https://twitter.com/jmspool Deja tu zona de confort, ahí no sucede nada.
• Susan Weinschenk - https://twitter.com/thebrainlady
• Steven Hoober - https://twitter.com/shoobe01 NO TE RINDAS
• Laura Klein - https://twitter.com/lauraklein Es probable que no consigas un trabajo en UX en tu primera aplica-
ción. Todas las organizaciones quieren a alguien que llegue directa-
Establece contacto con tantos como puedas. Puedes incluso mente a resolver problemas, para esto necesitas experiencia.
pedir consejo en algún proyecto actual en el que trabajes. Te ase-
guro que la mayoría estará gustoso de ayudarte. En realidad todos ¿Cómo conseguirla si nadie te la oportunidad? Es la pregunta del
los UX Designers seguimos aprendiendo y todos hemos pedido millón y no tiene respuesta única. Pero eso no puede detenerte.
ayuda en alguna ocasión. Participa en la comunidad UX, ya sea en Lee libros, artículos y publicaciones académicas, experimenta
eventos locales u online. Si quieres convertirte en uno debes estar con proyectos personales, asiste a eventos, toma entrenamien-
donde ellos están. Los eventos de tecnología y de aceleración de tos, consigue un mentor, entra a comunidades.
startups también son una buena fuente de contactos.
La idea básica es que inicies con algo. Inicia hoy.
BUSCA UN MENTOR
Reconoce que no eres el experto y que está bien que no lo sepas todo. Cada conocimiento nuevo que adquieras aumentará el valor de tu
Es la única manera de seguir aprendiendo. Es altamente recomenda- carrera. Tu futuro es algo que no puedes pasar por alto.
ble que consigas que alguien te guíe en el camino, un UX Designer
experimentado y que esté dispuesto a invertir su tiempo en ti. Referencias
[1] M. León. “4 Actividades UX para Resolver Controversias de Desarrollo. SG Software
El rasgo de personalidad que buscarán en ti es básicamente la Guru #49. http://swgu.ru/rc
curiosidad. No tienes que hacer nada para demostrarla, él o ella [2] H. Loranger. “UX Without User Research Is Not UX“. Nielsen Norman Group.
se darán cuenta de inmediato. http://swgu.ru/rd

SG.COM.MX 035
P CALIDAD

¿Sigue Siendo Importante el


Aseguramiento de Calidad?

Por Roselyn C. Piñango

Las últimas tendencias en tecnología y la dinámica corporativa le permitan indagar en las fallas encontradas en los sistemas o
han incorporado nuevos puntos de control y aseguramiento de infraestructura asociada a la prueba. No obstante, las empresas
calidad incluyendo una gama de herramientas CAST (Computer siguen valorando a los probadores certificados en estándares
Aided Software Testing) que facilitan la prevención y detección como ISTQB, TMMI e IREB porque les permite desarrollar las
de defectos. Adicionalmente, las metodologías ágiles incluyen re- cualidades analíticas, críticas, minuciosas de un buen probador.
visiones continuas para evitar el impacto que antes representaba
trabajar en islas o encontrar defectos cuando un software ya está En aras de agilizar los procesos, las herramientas CAST consti-
en producción. Esto puede llevar a que nos preguntemos: ¿las tuyen un elemento fundamental. Existen herramientas para to-
nuevas tendencias en desarrollo de software pueden reemplazar dos los aspectos del proceso de pruebas, así que es importante
al aseguramiento de calidad del software (SQA)?, ¿sigue siendo contemplar herramientas que se comuniquen entre sí, y con otras
importante el SQA? herramientas utilizadas para otras áreas del ciclo de vida.

La verificación y validación del software son actividades impres- Cuando el tiempo y presupuesto se convierten en los “únicos cri-
cindibles para asegurar la calidad y así, evitar costos por fallas en terios de salida válidos”, es el equipo de prueba quien puede tomar
producción. La calidad no es un valor agregado, es un “commodity” las mejores decisiones enfocando las pruebas en base al riesgo.
más; la automatización de pruebas parece estar reemplazando a los
probadores manuales. En cuanto a las CAST, existen avances en he- Las estrategias de pruebas deben ser flexibles y adaptarse a los
rramientas capaces de derivar casos de prueba en función de algo- distintos tipos de pruebas para borrar el mito que el probador es
ritmos utilizando técnicas como tablas de decisión. sólo funcional. Se debe impulsar las pruebas de fiabilidad, usabi-
lidad, eficiencia, mantenibilidad y portabilidad.
La prueba de software está muy vigente, pero tiene un enfo-
que más técnico que antes, predominando los casos de prueba La automatización como mecanismo para agilizar tareas y brin-
de seguridad y usabilidad en la nube, aplicaciones móviles, Big dar confianza sigue siendo indispensable sobre todo en la fase de
Data y próximamente en entornos de realidad virtual. Además, implementación y ejecución para minimizar el número de casos
el negocio exige pruebas ágiles y las aplicaciones se vuelven más manuales. Igualmente debe considerarse en el nivel de pruebas
complejas: una aplicación móvil no sólo tiene la misma comple- de componente para que sean utilizados en las pruebas de regre-
jidad funcional que los aplicativos web además cuenta con sus sión que se necesiten.
propios requisitos de interfaz, procesos y dependencias de la in-
fraestructura. Las aplicaciones ahora están conectadas, engloban Garantizar el máximo nivel de independencia de las pruebas
procesos de compra en línea, recolección de datos o trabajan bajo sigue siendo tendencia y aumenta el número de empresas que
entornos distribuidos. contratan fábricas de prueba especializadas para sus procesos
de pruebas e impulsar las actividades constructivas y analíticas
Ante este escenario, hay un panorama claro para SQA: debe cam- de SQA enfocadas no solo a detectar sino prevenir los defectos
biar los paradigmas que han marcado pauta en las acciones de (métricas, estándares, revisiones).
los probadores hasta hoy, para acelerar procesos cuando ahora
la velocidad es tan importante como la calidad. A continuación El equipo de SQA se fortalece con nuevas tecnologías que le per-
se presentan caminos que son y seguirán siendo tendencia en los miten trabajar de forma remota, ejecutar pruebas aún sin la in-
próximos años: tervención humana y adueñarse de una visión técnico-funcional
difícil de lograr en otros ámbitos del desarrollo de software. Para
Las nuevas metodologías apoyan que el negocio, probadores y ello debe adecuar su marco de trabajo con el fin de poder asumir y
programadores formen un equipo multidisciplinario con lo cual dar respuesta a las nuevas características y necesidades del mer-
deben rediseñarse prácticas arraigadas: cascada, enormes requi- cado. Sin embargo, esto implica una transformación radical en la
sitos, incapacidad para probarlo todo, entre otras. manera de enfocar las pruebas. Mientras utilice la innovación a su
favor en su misión por reducir los riesgos de detectar defectos en
El enfoque de las pruebas debe contemplar verificaciones técni- producción, brindar información y satisfacer compromisos.
cas, por ello el probador requiere capacitarse en bases de datos,
lenguajes de programación, sistemas operativos y entornos que En resumen, SQA seguirá existiendo pues la calidad no caduca.

Roselyn C. Piñango Díaz es Gerente de QA Factory en Global R en Venezuela. Es Ingeniero en Computación con Especialización en Sistemas de Información y tiene más de 10 años de
experiencia en desarrollo y pruebas de software.

036 SG.50
SG.COM.MX 037
P ÁGIL

Resistencia al Cambio
y Enfoque en el Cliente —
Por Masa K. Maeda

Dos clientes con los que hemos trabajado recientemente organización y resultar en pérdidas o inclusive en colapso total.
decidieron desplegar los siguientes patrones de comporta- Un verdadero enfoque en el cliente sucede cuando en lugar de
miento: deseo ferviente de satisfacer al cliente y resistencia decir “sí” a todo lo solicitado aseguramos que el cliente reciba lo
al cambio. En principio esto puede parecer muy bueno, pero que realmente necesita.
¿cuáles son las implicaciones y consecuencias de esos com-
portamientos en una organización? Con respecto a “resistencia al cambio”, quienes se comportan de
esa forma típicamente lo hacen para minimizar riesgo o por creer
El deseo ferviente de satisfacer al cliente parecería ser una forma que sus soluciones ya son las ideales y no hay espacio de mejorar.
obvia de incrementar negocio y no estar sujeto a discusión. Sin
embargo esto puede ser un gran error y resultar en el colapso de En el ambiente profesional y en toda industria, el riesgo más alto
la empresa. es no tomar riesgos porque la competencia tomará la delantera y
la empresa misma terminará en la obsolescencia. Esto es aplica-
Es correcto enfocarse en el cliente, pero al mismo tiempo es inco- ble a todo nivel de la empresa, ya sea una división, departamento,
rrecto hacer todo lo que el cliente solicita. La mayoría de las veces proyecto, equipo o individuo.
el cliente solamente tienen una idea de lo que desea. ¿Cuántas
veces te has reunido con un cliente para que te explique un reque- El temor a fallar puede ser interno, en cuyo caso se debe cuestionar
rimiento y durante la conversación te das cuenta que tan solo es si la persona es apta para ser líder. Pero puede ser también un pro-
una idea y la va definiendo sobre la marcha? ¿Cuántas veces con- blema de cultura organizacional como sucede en algunas organiza-
forme construimos lo que solicitó el cliente se generan cambios, ciones donde las fallas tienen consecuencias muy altas por lo que la
adiciones o eliminaciones? Muchas sin lugar a duda. gente no se atreve a hacer cosas nuevas o diferentes. Toda empresa,
organización, y persona tienen siempre espacio para mejorar. Las
¿A qué se debe esto? No es que el cliente fue irresponsable o personas que piensan lo opuesto están cegadas a la realidad.
que no dedicó el tiempo suficiente para pensar bien lo deseado.
Esto se debe a que siempre se iniciará con una idea e indepen- Para algunas personas es simplemente conveniente resistir al
dientemente de cuánto el cliente pudo llegar a detallar, es nuestra cambio ya sea para evitar el esfuerzo requerido, por motivo de
responsabilidad ayudar al cliente a madurar esa idea. También se capital político o financiero. También hay quienes se resisten al
debe a que la naturaleza misma de trabajo de conocimiento es de cambio simplemente por ser desconocido y no les interesa cono-
cambio. Los cambios pueden ser debido a factores externos (eco- cer otras opciones.
nómicos, sociales, de mercado) o internos (presupuesto, cambio
de estrategia). Dentro del agilismo se discute mucho todo esto. Sin embargo, no
es un reto único del agilismo. En una medida u otra ocurre en todo
Muchos líderes de proyecto piensan que no deben cuestionar al tipo de empresas, ya sea con respecto a las metodologías ágiles o
cliente y mucho menos confrontarlo. Estoy de acuerdo en mane- cualquier otra cosa. Suele ser más notorio en el caso del agilismo
jar con delicadeza al cliente, pero eso no le resuelve su problema. porque su naturaleza es más distante a los enfoques tradicionales.
Si presentamos un argumento económico que muestre el impacto
negativo de una idea o solicitud, el cliente lo apreciará y estará aún El agilismo no es una moda porque no es algo nuevo (se inició a
más agradecido si se le presenta por lo menos una alternativa. principios de los 90) y existen miles de casos en todo el mundo que
demuestran sus beneficios. Al mismo tiempo es de suma impor-
El enfoque al cliente debe hacerse de manera adecuada, pues tancia que los tomadores de decisiones se informen bien antes de
hacerlo de manera ciega puede fácilmente comprometer a tu decidir cuál o cuáles de las metodologías ágiles adoptar.

El Dr. Masa Maeda es CEO fundador de Valueinnova, LLC. Cuenta con clientes de todo tamaño, desde Fortune 500 hasta startups en 12 países en 4 continentes. Es el autor de libro Serious
LeAP, y coautor del libro España Lean Startup Nation. Tiene más de 60 publicaciones y numerosas presentaciones magistrales en conferencias internacionales. Previamente hizo investiga-
ción y desarrollo para Apple Inc. y fue miembro de los grupos fundadores de 4 empresas en Silicon Valley.

038 SG.50
SG.COM.MX 039
C PRUEBA DE SOFTWARE

Nota del editor: En el número anterior de SG se publicó este artículo pero por un error en la edición no se hizo el uso adecuado de índices
en las expresiones matemáticas y por ello estas eran incomprensibles. Así que decidimos republicar el artículo corregido. En la siguiente
edición de SG continuaremos con la parte 3.

Special Purpose Languages


PARTE 2. ALGUNAS DEFINICIONES

Por Luis Vinicio León Carrillo

En el número anterior hice alusión a la plática que ofrecí en Como pueden observar, este pequeño patrón, descrito con esa
el pasado SG Conference & Expo. Durante ella analizamos bre- sencilla y única regla, parece describir el crecimiento de una
vemente la problemática que dio origen a la llamada “Crisis planta (solo en 2 dimensiones). Lenguajes en los que las reglas
del software” (a partir de la cual se acuñó por cierto el término se aplican en paralelo, se han utilizado para describir fenómenos
“Ingeniería de Software” en los 60), y describimos algunos enfo- de este tipo, y han dado lugar a toda una jerarquía de lenguajes
ques que se han aplicado para abatirla, entre ellos los métodos conocida como Sistemas Lindenmayer (L-Systems), los cuales a
formales, los cuales definimos y describimos brevemente en el su vez tienen relación con los fractales (el todo contenido en cada
número anterior y vimos que utilizan lenguajes formales (que parte). Este enfoque viene de la biología (su creadora, Aristid
definimos de manera no-formal) procesados por compiladores. Lindenmayer, era bióloga).

El “estado del arte” de nuestra industria ha estado fuertemente Por otro lado, los lenguajes que utilizamos en la computación uti-
influenciado por el desarrollo de los que llamo: “lenguajes de lizan reglas que se aplican no tanto en paralelo, sino más bien
computación”, que incluyen tanto los lenguajes de programa- secuencialmente, y se definen con un marco conceptual que pro-
ción (de bajo y alto nivel; de primera, segunda, tercera, cuarta viene de la Lingüística (Chomsky es lingüista).
y quinta generación; procedurales, funcionales y lógicos, etc.),
como los lenguajes de documentación, de especificación, y de Pero antes de entrar más en detalle con este último enfoque,
arquitectura, entre otros. déjenme abordar algunas cuestiones fundamentales utilizando
el enfoque de conjuntos. Por favor, no pierdan de vista que esta-
En general, dichos lenguajes nos sirven para formalizar patrones mos haciendo esto porque queremos describir cómo construir
que posibilitan la automatización. special purpose languages propietarios para incrementar la pro-
ductividad y la calidad de nuestros procesos de desarrollo (y
Un caso un tanto distinto es el que comenzamos a revisar en el prueba) de software.
número pasado, en el que les pedí aplicar 3 veces la siguiente
regla/patrón haciendo las sustituciones siempre en paralelo. Definiciones
Un alfabeto es un conjunto finito de letras. En el caso del Español,
ese conjunto tiene 30 letras (contando la ch, ll y la ü), con las cua-
les podemos construir palabras, oraciones y textos “correctos” en
ese idioma, pero también frases que no se consideran parte del
mismo (como “añu is morgen”). Podemos decir entonces que el
Español es un conjunto de frases consideradas “correctas”, el cual
Por cuestión de espacio expongo aquí solo las primeras 2 trans- a su vez es un subconjunto del de todas las frases que pueden
formaciones, en las que los colores tienen la intención de ayu- escribirse con su alfabeto.
dar al seguimiento de las sustituciones (noten que hay ligeras
variaciones en algunas inclinaciones de las figuras; finalmente las Generalicemos un poco y definamos el alfabeto B = {b1, b2, …, bn}, un
plantas son sistemas adaptativos). conjunto finito que contiene n caracteres. Diremos que tiene una
cardinalidad de n, y lo escribiremos |B| = n.

Definamos ahora la concatenación entre caracteres de un alfa-


beto B como sigue:

Luis Vinicio León Carrillo es Director General y co-fundador de e-Quallity. Fue profesor-investigador en la universidad ITESO. Realizó estudios de posgrado en Alemania, durante los cuales
abordó temas relacionados con la prueba de software y los métodos y lenguajes formales.

040 SG.50
PRUEBA DE SOFTWARE
C

Los sistemas Lindenmayer describen fenómenos


en los que las reglas se aplican en paralelo.

bi · bj = bibj Lo anterior es cierto independientemente de la cantidad


bi · λ = λ · bi = bi (λ es la “cadena vacía: una cadena sin letras) de elementos de B. Si B fuera la más grande extensión del
( bi · bj ) · bk = bi · (bj · bk ) = bibjbk código ASCII, esto implica que la cantidad de cadenas de
caracteres que podemos escribir en una computadora (o en
Adicionalmente, definamos el alfabeto C = {c1, c2, …, cm}; C es tam- cualquier dispositivo para procesar información) es infinita,
bién finito, con |C| = m. pero es contable.

Definamos la concatenación entre conjuntos de caracteres: Finalmente: dado el conjunto A, ɚ(A) (“el conjunto potencia del
conjunto A”) denota el conjunto conformado por los subconjun-
B · C = { b1c1 , b1c2 , …, b1cm , tos de A. Algunos ejemplos:
b2c1 , b2c2 , …, b2cm ,
…, Si A = { }, entonces ɚ(A) = {{}}, y |ɚ(A)| = 1.
bnc1 , bnc2 , …, bncm } Si A = { a1 }, entonces ɚ(A) = {{}, {a1 }}, y |ɚ(A)| = 2.
Si A = { a1, a2 }, entonces ɚ(A) = {{}, {a1 }, {a2 }, {a1, a2} }, y |ɚ(A)| = 4.
B · C es también un conjunto finito, con cardinalidad |B·C | = n * m.
Podemos demostrar que en general, |ɚ(A)| = 2|A|.
Definamos ahora la exponenciación de la concatenación aplicada
a un conjunto de caracteres: Ahora estamos en posición de definir con mucha precisión qué es
un lenguaje en términos de conjuntos:
Bx = B · Bx-1
B0 = { λ } (El conjunto que tiene un solo elemento, que es la cadena vacía.) Dado un alfabeto finito B, un lenguaje formal sobre B es cual-
quier subconjunto de B* (dado un código ASCII extendido de 256
Bx es un conjunto finito, de cardinalidad |Bx| = |B|x + 1 (por la caracteres, Java es un subconjunto especial de cadenas escritas
cadena vacía). utilizando ese ASCII).

Ahora definamos la operación conocida como Cerradura de Kleene: Preguntas


Regresaremos al punto anterior más adelante, pero antes, qui-
B* = U∞i=0 Bi siera hacer notar que a partir de lo descrito anteriormente se des-
= B0 U B1 U B2 U B3 U ... prenden varias preguntas interesantes:
= { λ, (1 cadena de tamaño 0)
b1, b2, …, bn , (n cadenas de tamaño 1) • Dado un alfabeto B, ¿cuántos lenguajes podemos construir
b1b1 , b1b2 , …, b1bn , (n2 cadenas de tamaño 2), con sus caracteres?
b2b1 , b2b2 , …, b2bn , • ¿Podríamos procesarlos todos? (v.gr. mediante compilado-
…, res o intérpretes)
bnb1 , bnb2 , …, bnbn , • ¿Qué tan complejo y eficiente sería ese procesamiento? (en
…} (n3 cadenas de tamaño 3 y así sucesivamente) términos computacionales)

Ciertamente, B* es un conjunto infinito, pero de los que llama- Piensen sus respuestas; continuaremos abordando este tema en
mos “contable”, pues podemos utilizar los números naturales el siguiente número.
IN (IN = {0, 1, 2, …}) para listar todos sus elementos en orden:
para i = 0 (un número natural) sabemos que hay 1 cadena (otro
número natural), para i = 1 sabemos que hay n cadenas, para
i = 2 hay n2, y así sucesivamente. Esto permite decir que la
cardinalidad de B* es la misma que la de IN. En otras palabras: Referencias
dado el alfabeto finito B, podemos construir tantas cadenas [1] L. León. “Los Special Purpose Languages, parte 1”. Revista Software Guru #48.
con sus caracteres como números naturales hay. http://sg.com.mx/revista/48/los-special-purpose-languages-0

SG.COM.MX 041
C PROGRAMAR ES UN MODO DE VIDA

Sobre los pasos de Donald Knuth


CONVIRTIENDO AL ARTE EN CIENCIA

Por Gunnar Wolf

La ciencia es el conocimiento que comprendemos tan bien arbitrarios de una forma repetible, controlable, moni-
que podemos enseñárselo incluso a una computadora; si toreable. Esto es, darse cuenta cómo para práctica-
no entendemos cabalmente algo, manejarlo es un arte mente cualquier ámbito profesional, puede ser útil
aprender a programar (y posteriormente, claro está,
(…) entrar al interminable laberinto fractal que supone afi-
nar nuestras habilidades como programador).
De tal suerte, debemos intentar continuamente transfor-
Gunnar Wolf es adminis- mar toda arte en una ciencia: Al hacerlo, lograremos su Pero muy poca gente puede compararse siquiera con
trador de sistemas para el avance como arte. Donald Knuth. Él es uno de los grandes pioneros de
Instituto de Investigaciones prácticamente todas las disciplinas relacionadas con
Económicas de la UNAM y – Donald Knuth, discurso de aceptación del la computación, una suerte de Da Vinci de los siglos
desarrollador del proyecto Premio Turing (1974) XX y XXI.
Debian GNU/Linux.
http://gwolf.org Y tal como Da Vinci, Knuth probablemente deba ser
En esta ocasión, dedicaré mi columna a una per- visto como artista en primer término, dado que todo
sona: Donald Erwin Knuth, alrededor de quien mi lo demás es mera consecuencia.
atención ha estado volando a últimas fechas, y a quien
debo parte importante de mi elección de carrera y Hemos visto que la programación de computadoras es
desarrollo profesional. un arte, puesto que aplica el conocimiento acumulado
al mundo, porque requiere de habilidad y de ingenui-
Tenemos el privilegio de trabajar en un campo sufi- dad, y especialmente porque puede producir objetos
cientemente joven como para ser contemporáneos de gran belleza. Un programador que subconsciente-
con quienes establecieron su mismísimo significado. mente se ve a sí mismo como artista disfrutará de lo
Gente que viene de formarse en campos disciplinarios que hace y lo hará mejor.
disímiles y fue convergiendo en el naciente campo de
la computación, sea por la vía de las ciencias duras, la – Donald Knuth, discurso de aceptación del
ingeniería, la administración o el arte. Premio Turing (1974)

El árbol genealógico disciplinar de la computación


está fuertemente dominado, claro, por los matemáti- El trabajo de Knuth parte de un disfrute estético, no
cos. En muchas universidades, las principales carreras únicamente funcional. Un enamoramiento con los di-
relacionadas siguen siendo parte de los departamen- ferentes niveles de lo que su código alcanza. Y eso ex-
tos de matemáticas, o (en el caso de las ingenierías) plica, a distintos niveles de abstracción, el camino por
requieren un estudio de un par de años de principios el que llevó a su carrera. Citemos algunos ejemplos.
matemáticos apenas para “calentar motores” e iniciar
con las materias específicas del ramo. En 1962, Knuth comenzó a escribir lo que esperaba
que fuera un simple libro de texto para la enseñanza de
La computación también se caracteriza por ser muy algoritmos —The art of computer programming. Cuatro
permeable a gente que desarrolló sus competencias años más tarde, siendo aún un alumno de posgrado,
profesionales de manera no formal. ¿Quién de uste- entregó al editor un primer borrador: más de 3,000
des no ha tenido el gusto de trabajar con colegas cuyo páginas manuscritas. Pero siendo un perfeccionista,
currículum formal parecía apuntar hacia futuros muy sería este libro más lo que guiaría prácticamente la
distintos? En lo particular, mis colegas y maestros totalidad de su vida académica: pasados más de 50
incluyen químicos, músicos, físicos, psicólogos, ma- años, el libro (convertido en una serie de volúmenes
temáticos, sociólogos, y un largo etcétera (donde sin de referencia) sigue en desarrollo.
duda entramos los autodidactas puros, quienes no se-
guimos una carrera universitaria formal). Todos ellos Knuth siguió desarrollando y embelleciendo su texto,
comparten un punto en su historia profesional per- preparándolo para la impresión. La ancestral técnica
sonal: reconocer la ventaja de automatizar procesos de impresión por tipos móviles, que incluía el fundido

042 SG.50
PROGRAMAR ES UN MODO DE VIDA
C

de piezas especiales para generar las complejas fórmulas reque- las revistas académicas de las ciencias exactas e ingenierías lo em-
ridas por las matemáticas, comenzó a encarecer y quedar fuera plean como su principal formato para la entrega de originales.
del alcance para su proyecto.
Cambiemos nuestra actitud tradicional respecto a la construcción
Conforme avanzaba la tecnología, resultó natural que el libro sería de los programas: en vez de imaginar que nuestra tarea princi-
formado por computadora… Pero las herramientas disponibles a pal es darle las instrucciones de qué hacer a una computadora,
principios y mediados de 1970 sencillamente no estaban a la altura concentrémonos en explicarle a los humanos lo que queremos que
estética de una obra con un alta carga de símbolos matemáticos, la computadora haga.
estructurada con distintos niveles de seccionamiento, cargadas de
referencias internas y externas, y Knuth hizo lo que solo un verda- – Donald Knuth, Literate programming, 1984
dero hacker haría: diseñar su propio sistema de edición de texto,
TeX.1 Liberó la primera versión en 1978, y la última versión mayor
que introducía cambios no-compatibles, 3.0, en 1989. Mencionábamos que Knuth apunta a un disfrute estético a diferen-
tes niveles de abstracción. Agreguemos otro nivel más: el paradigma
Al día de hoy, Knuth ha terminado formalmente tres volúmenes (de de programación que impulsa; es decir, la computación literaria.
siete que, estima, cubren suficientemente bien el campo) y avanzado
fuertemente en el cuarto, que va siendo publicado por fascículos. Este paradigma propone que un programa debe ser escrito cual si
fuera (dependiendo de su complejidad) como un libro, tratado o
Me permito mencionar, como un punto muy lateral y con un dejo artículo estructurado para su lectura humana, en el cual el código
de soberbia en el tono, que TeX es uno de los puntos definitorios fuera el material que acompaña a la exposición lógica. Por medio
de mi vida: es el primer programa de cómputo que aprendí a usar. de un preprocesador, el documento maestro puede exportarse
Knuth visitó el IIMAS (UNAM), donde con su ayuda se instaló una tanto a una versión imprimible como a una compilable. Pueden
versión temprana de TeX. Y al día de hoy agradezco a diario a mi consultar un sistema de preparación de documentos para docu-
padre, investigador en física, las muchas noches de viernes y sá- mentación literaria en la página de CWEB3 si bien es cierto que
bado que me llevó, aún niño, a “jugar” a la sala de terminales, donde no todo programa puede verse beneficiado por esta lógica, la cla-
hice mis pininos en TeX en 1983. Para 1985, mi padre y un grupo de ridad resultante es notoria.
colegas editaron empleando dicho sistema el Manual de Lenguaje
y Tipografía Científica en Castellano2, libro que recomiendo a todo Knuth es, pues, una inspiración en lo estético y en lo funcional, en
interesado en la escritura técnica formal y en el correcto uso de el purismo matemático y en la limpieza de la implementación. Si
nuestro idioma. Hasta donde sé, es la tercera instalación de TeX acaso, podría criticársele la falta de pragmatismo ante su obsesión
en el mundo. Si comparan el libro referido con prácticamente cual- por la perfección; sus elevados estándares harían enfurecer a cual-
quier obra impresa en esos años notarán, a pesar de sus imper- quier project manager. Pero sus contribuciones al avance de nuestra
fecciones técnicas en comparación de nuestra era de super-altas disciplina han sido, naturalmente, correspondientemente brillantes.
resoluciones, una enorme diferencia cualitativa.
Espero, con este breve y desordenado texto, dar a conocer algo
Knuth se comprometió a que, después de la versión 3.0, la interfaz más de la obra de Knuth, para que inspire a nuestros lectores.
de TeX no tendría ningún cambio que rompiera la compatibilidad; Autores de su talla conjuntan ciencia y arte. El tezón para realizar
todo texto debería resultar idéntico sin importar en qué equipo de proyectos de décadas de envergadura hace posible avances que
cómputo se preparara. Como un guiño de humor hacker, todas las otros descartarían por impracticables. Y la apreciación por la be-
versiones menores subsecuentes se irían acercando a la perfección lleza lleva a un disfrute en el ejercicio diario de nuestras tareas.
simbolizada por el número π; la versión actual (liberada en enero
de 2014) es la 3.14159265. Knuth, quien hoy tiene 78 años y aun- ¡Larga vida al maestro Knuth!
que formalmente retirado sigue trabajando para terminar su princi-
pal obra a la cual volveremos, autorizó que post-mortem se efectúe
un último cambio a TeX, congelando para siempre su versión en π. 1 Pronunciado “Tej”, Del griego τεχνή, palabra que denota ya sea al arte o a la técnica.
La grafía oficial de TeX es con sus tres letras en mayúscula, pero con la “e” más baja, y el
TeX, de la mano del conjunto de macros LaTeX diseñado por Leslie espaciado intercaracteres reducido.
Lamport principalmente entre 1985 y 1995, se convirtió en el sistema 2 Disponible en http://www.fis.unam.mx/~bwolf/manual.html
de elección para la edición de textos científicos; prácticamente todas 3 http://www-cs-faculty.stanford.edu/~uno/cweb.html

SG.COM.MX 043
C CLAVE MORSA

Dinámica de Teclado
NO ES LO QUE ESCRIBES, SINO CÓMO LO ESCRIBES ...

Por Manuel López Michelone

Imaginemos que alguien tiene la contraseña de nues- de un microsegundo. Una opción es el componente THPCounter
tra computadora y se dispone a ingresar a ella con algún fin creado como Mats Asplund, que expone los métodos Start y
dañino. Pero al introducir la contraseña, el sistema no lo reco- Read para hacer mediciones de tiempo en microsegundos. El
noce y por ende no le da acceso. ¿Magia? De ninguna manera: listado 1 muestra cómo podríamos usar este componente para
es la biométrica del teclado. nuestro propósito.

La biométrica es la medida de las características físicas y de


comportamiento que hace único a cada ser humano. A diferen-
cia de los nombres/contraseñas de los sistemas de cómputo,
ciertas medidas biométricas no se pierden, no pueden ser dupli-
cadas o robadas. Pertenecen a cada ser humano en particular.
Esto da la posibilidad de sistemas que sean imposibles de ser
violados por terceros de manera ilegal, puesto que la informa-
ción biométrica de los usuarios es única e irrepetible. Las carac-
terísticas fisiológicas como pueden ser las huellas digitales,
son buenas candidatas para la identificación de personas. La
biométrica está ganando popularidad, porque cuando es usada
en conjunto con métodos como contraseñas, proveen un nivel
extra de seguridad. Algunos de los sistemas biométricos usa-
dos para identificación humana se basan en la geometría de las
manos, patrones térmicos en el rostro, las venas en la retina, voz
y firmas manuscritas. Algunos esquemas son muy invasivos,
como leer el iris ocular. La dinámica del teclado es un esquema
biométrico poco invasivo y de bajo costo que puede ayudar a
complementar otros mecanismos de seguridad.

La manera en cómo los seres humanos escribimos en un teclado Figura 1. Generación de perfil en base a dinámica de teclado.
de computadora tiene un ritmo específico para cada persona.
Es en cierta forma una medición biométrica, pues depende Para poder graficar estos datos podemos usar otro componente
de los rasgos del comportamiento particular de cada usuario. de código abierto y gratuito: “XYGraph”, de U. U.Jürß. Con dicho
Si podemos medir el tiempo que un usuario tarda en registrar componente, es trivial generar una gráfica donde en el eje de las
su contraseña en el sistema de cómputo, podremos crear un X representemos cada presión de una tecla, y en el de las Y el
“perfil” digital que describa este ritmo en su manera de teclear, tiempo transcurrido.
de manera tal que pueda añadirse como una medida extra a la
seguridad de los sistemas. Una vez resueltos estos problemas, nació un pequeño programa
de demostración que muestra la bondad de la idea. Para que sea
Hacer un programa que mida los tiempos entre teclas presio- más ilustrativo el asunto, una gráfica en el software muestra el
nadas no es muy complicado. Por ejemplo, en Delphi (lenguaje perfil biométrico del usuario, que en principio, debería repetirse.
usado para los ejemplos de este artículo) existen diversos com- Y efectivamente este perfil se repite, no estrictamente con una
ponentes, que permiten medir eventos hasta con una resolución precisión única, pero sí en promedio. De alguna manera se parece

Manuel López Michelone (@morsa) es Físico por la UNAM y maestro en Ciencias por la Universidad de Essex en el tema de Inteligencia Artificial. Ha sido columnista por muchos años en
publicaciones de la industria del cómputo y ávido programador. Actualmente realiza su doctorado en ciencias de la computación en la UNAM. morsa@la-morsa.com

044 SG.50
CLAVE MORSA
C

La manera en cómo los seres humanos escribimos


en un teclado de computadora tiene un ritmo
específico para cada persona.

a la firma que estampamos en un cheque. Es claro que la firma no El listado 2 tiene el código que hace la comparación entre una
siempre nos sale estrictamente igual, pero el cajero, al ver nuestro contraseña alimentada y la que el usuario escribe para así hacer
cheque, hace una comparación visual de la firma contra la que la comparación:
tiene en sus registros y decide si paga un cheque o lo rechaza.

De la misma manera, el perfil digital de un usuario al escribir su


contraseña puede ser usado para dar acceso a un sistema de
cómputo o bien, para rechazarlo. La pregunta en este caso era
¿cómo hacer para comparar el perfil digital contra la contraseña
escrita? Existen multitud de ideas de cómo analizar esta informa-
ción, desde estadística descriptiva hasta el uso de redes neuro-
nales. El enfoque usado fue el de intentar hacer una comparación
“visual” entre el perfil de una contraseña y el perfil capturado al
alimentar la contraseña para dar acceso al sistema.

Evidentemente la computadora no tiene ojos, así que la alterna-


tiva es utilizar los conceptos de cálculo elemental, y así resolver
el problema, por lo menos en una primera aproximación. Para
mantener simple el problema, se usó el concepto de pendiente.
Un perfil está formado por puntos que se conectan (el primero
con el segundo, el segundo con el tercero, etc.). Cuando el usua-
rio escribe su contraseña, encontramos que la conexión de estos Figura 2. Comparación del perfil obtenido contra el de referencia.
puntos nos da gráficas de “dientes de sierra”, ya que el brinco de
un carácter a otro es discreto (lo contrario de la continuidad). Así, SlopePswd y SlopePerfil son dos arreglos de variables booleanas
lo que tenemos son dientes de sierra que no necesariamente son que contienen la descripción de cuántas pendientes son positi-
todos de la misma distancia. Ésta dependerá del tiempo que se vas o negativas.
tarde el usuario en oprimir una tecla en particular. De esta manera
podemos medir la pendiente, es decir, el grado de inclinación de EJEMPLO REAL
cada recta que forma el perfil digital. La figura 1 muestra la graficación de dos perfiles generados al
escribir la contraseña “La_Morsita” por el mismo usuario. En
De la misma manera, cuando un usuario define su contraseña, rojo apreciamos el perfil generado cuando el usuario definió
podemos medir su perfil y guardar esa huella, para compararla la contraseña originalmente, y en azul el perfil cuando escri-
posteriormente con el perfil generado cuando alguien intenta bió la contraseña en una ocasión posterior para autenticarse.
ingresar al sistema usando la contraseña. De acuerdo a la can- Aunque los perfiles no son exactamente iguales, hay bastante
tidad de datos similares, podemos decidir dar acceso o recha- similitud y de hecho el cálculo del porcentaje de coincidencias
zar al usuario. Obviamente, considerando que esta medida es nos arroja un 89%.
similar a la firma manuscrita, entonces debemos tener un fac-
tor de tolerancia en la similitud de las curvas, un umbral, un En comparación, la figura 2 muestra otra vez el perfil original
mecanismo de tolerancia pues es claro que es muy difícil que en rojo, pero ahora acompañado de un perfil en azul generado
podamos repetir estrictamente el perfil guardado en la base de cuando una persona distinta introdujo la misma contraseña.
datos con el cual se compara cuando escribimos la contraseña. Podemos apreciar que aunque el patrón general es similar, el
De acuerdo a esto, podemos tener un criterio más o menos ritmo de los tiempos es distinto. El porcentaje de coincidencias es
flexible, dependiendo del nivel de seguridad que deseemos de 59%, lo cual es suficientemente bajo como para no autenticar
imponer en nuestros sistemas. a la persona en cuestión.

SG.COM.MX 045
C CLAVE MORSA

El factor de tolerancia usado podría variar dependiendo de qué validar a usuarios legales de impostores, se necesitan pruebas
tan estrictos queramos ser, pero yo considero que entre un 65 y estadísticas considerando todo género de usuarios. Sin embargo,
75% sería adecuado en la mayoría de los casos. podemos concluir que el esquema del análisis de las pendientes,
considerando solamente si son positivas o negativas da un buen
acercamiento a la validez de la idea. Desde luego que es posible
generar más parámetros de comparación, así como una incerti-
dumbre de tolerancia, en donde una pendiente, por ejemplo, com-
parada contra la del perfil, sea igual en ±10%, por ejemplo. De
esta manera, se estaría incorporando más precisión a la compara-
ción, evitando así que un impostor pudiese, incluso conociendo el
método de verificación usado, duplicarlo.

Es evidente que si un usuario válido no se encuentra en las con-


diciones adecuadas para usarlo (está enfermo, drogado, etc.), el
sistema podría detectarlo como un usuario inválido y así evitar que
se introdujera al mismo. Más que un inconveniente, esto puede ser
útil para restringir acceso a sistemas con información muy sensible.

Cabe señalar que las pruebas se hicieron con un teclado estándar


de computadora, pero es obvio que el perfil de un usuario y su con-
traseña puede ser muy diferente si se usa un teclado de laptop o
Figura 1. Comparación de perfil de misma persona. computadora portátil. A la fecha no tenemos ninguna respuesta a
esta problemática. Esto quiere decir que el perfil de un usuario a tra-
vés de la dinámica del teclado es susceptible del tipo de teclado que
se está usando. Quizás en este caso la única manera de soslayar
esta dificultad sea subir el nivel de tolerancia sobre el perfil alimen-
tado contra el que pueda dar el usuario al alimentar la contraseña.

Conclusión
Un sistema basado en contraseñas y perfiles dinámicos del teclado
puede incrementar la seguridad de los sistemas de cómputo. Sin
embargo, entendemos que se necesita muchas más experiencias
prácticas para validar los beneficios de esta idea.

A quien le interese esta idea y el programa de demostración,


puede pedírmelo a mi correo electrónico: morsa@la-morsa.com,
el cual recibirá de forma gratuita por el mismo medio (incluyendo
el código fuente en Delphi).

Referencias
[1] F. Bergadano, D. Gunetti & C. Picardi. “User authentication through keystroke dynamics”.
ACM Transactions on Information and System Security Vol. 5 Issue 4. ACM, 2002.
Figura 2. Comparación de perfil de personas distintas. [2] D. Chudá, M. Durfina. “Multifactor authentication based on keystroke dynamics”.
CompSysTech ‘09 Proceedings of the International Conference on Computer Systems and
Technologies and Workshop for PhD Students in Computing. ACM, 2009.
Hay que indicar que para probar que este esquema de perfiles [3] R. Joyce, G. Gupta. “Identity authentication based on keystroke latencies”.
digitales biométricos, basados en el retardo entre teclas, pueda Communications of the ACM, Vol. 33 Issue 2. ACM, 1990.

046 SG.50
SG.COM.MX 047
V VOCES

En Defensa del Software


Por Mike Gregoire
Mike Gregoire es CEO de
CA Technologies.

Recientemente me encontré con dos artículos distintos sobre Ese alto nivel de precisión y flexibilidad es lo que hizo posible que
la industria del software. Uno decía que el mercado del “Internet unas cuantas personas en Volkswagen “hicieran trampa”. Pero
de las cosas” valdrá 7.1 trillones de dólares para el año 2020. El también es lo que hace que tantas nuevas tecnologías sean más
otro era un informe indicando que hackers habían accedido a rentables, eficientes en recursos y poderosas que sus predeceso-
datos personales de 15 millones de usuarios de una importante res mecánicos y analógicos.
empresa de telecomunicaciones.
En el contexto de cualquier proceso imaginable, el software ha-
A raíz del escándalo de las emisiones de diésel de Volkswagen, en bilita respuestas delicadas y variadas a una compleja gama de
el cuál se utilizaron d­ispositivos de desactivación y software para entradas, de una manera que los mecánicos hojalateros de an-
perpetuar un fraude, algunos se centran en los aspectos negativos taño nunca podrían haber soñado. En este momento, muchas de
asociados con el software. Así que los resultados de emisiones fal- las mentes más brillantes de todo el mundo están afanosamente
sas se han unido al acoso por internet y al robo de identidades elec- escribiendo software para resolver los principales problemas que
trónicas en la lista cada vez mayor de plagas digitales que corroen enfrenta la humanidad.
la sociedad moderna. Sin embargo, eso es solo una pequeña parte
de la historia. La historia más importante es el notable grado en el Es mucho más probable que los Thomas Edisons y Alexander
que el software se ha convertido en el centro de nuestras vidas, y Graham Bells de nuestra era se encuentren en un hackathon y no
una parte importante de la economía global. en un taller mecánico. Esto no debe interpretarse en el sentido de
que la ingeniería mecánica es un arte que esté muriendo. Lo que
En la economía de las aplicaciones de la actualidad, el software significa es que los ingenieros ya están acostumbrados a emplear
ejecuta todo, desde empresas gigantes hasta tu smartphone. La software para brindar inteligencia o valor agregado a los disposi-
mayoría de nosotros ahora compra todo tipo de cosas en línea, tivos mecánicos.
desde boletos de avión hasta el supermercado.
El software es ahora el rey. Está cambiando la forma de nuestras
En el ámbito empresarial, el software permite a las pequeñas em- ciudades, la forma en que nos comunicamos, cómo viajamos.
presas escalar rápidamente; acelera procesos y elimina barreras Impulsa el crecimiento económico, mejora la forma en la que el
transaccionales; habilita la automatización; genera datos objeti- gobierno trabaja y da resultados como, una mejor atención mé-
vos que pueden ser extraídos para impulsar innovación y mejorar dica. Se puede encontrar en todas partes en grandes cantidades.
la funcionalidad. Se está abriendo la puerta a modelos de negocio Los sistemas de control del avión de combate F-22 Raptor con-
completamente nuevos. tienen más de 8 millones de líneas de código. El Chevrolet Volt,
utiliza 10 millones de líneas de código. Mientras que la historia
Empresas como Google, Facebook, Microsoft, SAP, Uber, Oracle, ha demostrado que es posible construir aviones de combate y
Airbnb, Amazon, IBM, Salesforce, Twitter, Yahoo, eBay y CA —por automóviles eléctricos sin necesidad de utilizar ningún código
nombrar algunos— no se hubieran podido crear sin el software. Estas en absoluto, es bastante claro que ninguno de estos asombrosos
14 compañías por si solas emplean a más de un millón de personas, y vehículos podrían lograr la mitad de lo que hacen sin el beneficio
sus ingresos suman más que el PIB total de Austria. de un software innovador.

El impacto del software en la tecnología automotriz ofrece un caso Cada que surge una nueva tecnología, hay quienes tratan de apli-
revelador al respecto. Los nuevos productos digitales en tu automóvil carla para fines destructivos o fraudulentos. Pero no por eso cul-
no sólo sirven para ofrecerte buenas direcciones; estos también hacen pamos a Gutenberg de que nos llegue folletería promocional por
que tu coche funcione mejor. Hace muchos años los automóviles de- correo, o a los hermanos Wright por las políticas de equipaje de
jaron de tener carburadores, que son dispositivos mecánicos, y fueron las aerolíneas. Por supuesto que todos tenemos buenas razones
reemplazados por sistemas de inyección de combustible controlados para sentirnos engañados por las revelaciones que surgieron del
por software. El software puede hacer mejor el trabajo —ajustando caso de Volkswagen, desencadenadas por el juicio erróneo de
mezclas de combustible de aire con alta precisión para adaptarse a la un pequeño grupo de empleados. Sin embargo, eso no cambia
velocidad del automóvil, la carga del motor, condiciones atmosféricas el hecho de que el software continuará existiendo para hacer del
y las preferencias del operador. mundo un lugar mejor.

048 SG.50
VOCES
V

El Software Orientado al Consumidor y


Cómo Cambiará el Panorama para Siempre

Este artículo forma parte del reporte “Trend Watch 2016” publicado por National Instruments y disponible en http://www.ni.com/trend-watch .

Hace tiempo, cuando los protectores de LA EVOLUCIÓN DE LAS DEMANDAS UNA CONVERGENCIA INEVITABLE
camisa para bolígrafos eran funcionales y EN EL SOFTWARE DE INGENIERÍA Para los ingenieros, que se definen por
modernos (un ingeniero puede soñar, ¿no?), Los usuarios de software de ingeniería del el orgullo de conquistar retos comple-
el software de ingeniería y el software co- pasado típicamente se graduaban de la jos, esta confluencia de usabilidad y
mercial eran radicalmente distintos—no universidad con conocimiento de un solo sofisticación técnica no podía llegar en
solo por la gente que los utilizaba sino tam- lenguaje de programación. No era raro que mejor momento. Al no tener que dis-
bién por la forma en que se usaban. se metieran a bajo nivel para manejar ma- traerse en detalles de herramientas y
nualmente la memoria o los hilos (threads) técnicas de programación, ahora pue-
Sin embargo, ¿qué sucede cuando una de ejecución. El software era difícil e ina- den volver a centrarse en grandes retos
fuerza con gran dinámica (software co- bordable para quienes se atrevían a entrar de ingeniería. En este nuevo futuro, los
mercial) se encuentra con un objeto in- sin el entrenamiento adecuado. ingenieros pueden encontrar modos
móvil (software de ingeniería)? En el mejores y más rápidos de ir del punto
mercado actual, que demanda lo mejor de Pero de repente las cosas empezaron a A al B en lugar de perder tiempo reali-
dos mundos, los proveedores de software cambiar. En primer lugar, los ingenieros zando mejores mapas.
deben atender ese llamado. requirieron conocer una amplia variedad
de lenguajes de programación para po- Igualmente, esta convergencia significa
LA EVOLUCIÓN DEL SOFTWARE DE der enfrentar los retos laborales. Al igual que los ingenieros pueden avanzar hacia
CONSUMIDOR que un guerrero entrenado que cambia de un futuro en el que no son los únicos due-
La llegada del iPhone en 2007 vino a revo- espada a hacha y arco, el ingeniero actual ños de la innovación. Con software fácil
lucionar la experiencia de uso y expecta- puede entrar y salir de Python, C#, HTML, de utilizar, el resto del mundo está po-
tivas del software comercial gracias a su LabVIEW y Swift. Obligando a que estos niéndose al día. Además, al reconocer la
interfaz simple y fluida. Adicionalmente, lenguajes y herramientas sean accesibles prevalencia de la simplicidad y la belleza
su experiencia de compra y comunidad sin necesidad de conocimiento previo o en software de todo tipo, cada vez más
conectada expuso un nuevo mundo de entrenamiento formal. gente inteligente desempeñará papeles
extensibilidad al presentar una interfaz significativos en la resolución de proble-
para otra funcionalidad que no ofrecía En segundo lugar, el costo de acceder y mas importantes.
el proveedor primario. Su huella en la adquirir datos ha disminuido con rapi-
sociedad ha resultado tan indeleble que dez, mientras que aumenta la necesidad No se puede negar que nuestro mundo
incluso nuestras generaciones más jóve- de datos. Y conforme la tecnología está cada vez es más complicado y que nues-
nes se acercan a los monitores de escri- más conectada, ha disminuido el costo tros retos cada vez son más difíciles de
torio y esperan interactuar con ellos de de los procesadores. Según DataBeans, resolver. El que continuamente se nos so-
forma táctil. el precio de un procesador disminuyó en licite hacer más con menos dinero, menos
más de un 30 por ciento de 2011 a 2015. gente y menos tiempo, solo incrementa
“Los mismos conceptos que impulsan el Esto ha acelerado la necesidad de soft- la tensión. Cuanto antes lleguemos a la
movimiento Maker han rejuvenecido la ware muy accesible al introducir a más convergencia del software de ingeniería
ingeniería. En lugar de trabajar con proto- programadores “no tradicionales” en los y del software comercial, antes nos dare-
colos complejos que solo pueden entender mundos de la robótica, automatización mos cuenta de que lo “simple” es el mejor
los ingenieros, el software actual debe del hogar e incluso análisis y adquisición modo de resolver lo “complejo”.
proporcionar una interfaz accesible y com- de datos generales. Igualmente, las ten-
prensible para los que no son ingenieros a dencias culturales como el movimiento
nivel conceptual”. Maker y la aparición de empresas nuevas
de productos comerciales que son adqui-
—Bob O’Donnell, jefe analista de ridas por cantidades absurdas de dinero
TECHnalysis Research son otro ejemplo de este cambio.

SG.COM.MX 049
F FUNDAMENTOS

Entendiendo MapReduce

Por Pedro Galván

MapReduce es un modelo de programa- Shuffle: Consiste en distribuir los datos de todos los archivos de datos (es posi-
ción para resolver problemas por medio del a procesarse entre los distintos nodos. ble que una ciudad tenga varias ocurren-
procesamiento paralelo de grandes canti- Dicha asignación se hace basándose cias de datos en cada archivo). Usando
dades de datos en un clúster de cómputo. en la llave correspondiente, de manera MapReduce, podemos dividir esto en 5
que todos los datos pertenecientes a tareas de mapeo, donde cada mapeador
En esencia, el algoritmo MapReduce está cierta llave se asignen al mismo nodo trabaja en un archivo de entrada.
compuesto de un procedimiento de mapeo de procesamiento.
(Map) y otro de reducción (Reduce). El ma- El resultado de procesar el contenido del
peo se enfoca en filtrar y organizar los datos Reduce: Es cuando se procesan los da- archivo previamente indicado sería el
(por ejemplo tomar datos de estudiantes tos en paralelo a través de los distintos siguiente:
y organizarlos en grupos de acuerdo a su nodos, cada nodo se dedica a combinar/
nombre de pila) mientras que la reducción reducir los datos que le fueron asignados <México, 20> <Lima, 25> <Bogotá, 22> <Buenos Aires, 33>
se dedica a combinar y sumarizar datos (por para crear un nuevo conjunto de datos
ejemplo contar el número de estudiantes sumarizado. Imaginemos que el resultado de procesar
que hay en cada grupo identificado). los otros 4 archivos es el siguiente:
Como ya comentamos, el framework
Si MapReduce es un modelo, ¿por qué es MapReduce opera en base a pares <llave, va- <México, 18> <Lima, 27> <Bogotá, 32> <Buenos Aires, 37>
común referirse a éste como una tecnología lor>. Es decir, las entradas de datos son vistas <México, 32> <Lima, 20> <Bogotá, 33> <Buenos Aires, 38>
o implementación? Lo que sucede es que como conjuntos de pares <llave, valor> y el <México, 22> <Lima, 19> <Bogotá, 20> <Buenos Aires, 31>
para ejecutar tareas de tipo MapReduce resultado de procesarlos es un nuevo con- <México, 31> <Lima, 22> <Bogotá, 19> <Buenos Aires, 30>
se requiere de un sistema de software que junto de pares <llave, valor>, posiblemente
orqueste el procesamiento paralelo, gestio- con otro tipo de datos. Todos estos resultados se podrían alimen-
nando la comunicación y transferencia de tar de nueva cuenta a la tarea de reduc-
datos entre los distintos nodos de procesa- La tabla 1 refleja la estructura de los pares ción, que combinaría los distintos datos y
miento. Así que MapReduce es un modelo de datos al entrar y salir de cada etapa. generaría un valor único para cada ciudad.
de programación acompañado de una im- El resultado sería:
plementación. MapReduce fue creado (tanto Entrada Salida
el modelo como la implementación original) Map <k1, v1> list (<k2, v2>) <México, 32> <Lima, 27> <Bogotá, 33> <Buenos Aires, 38>
por Google y presentado al público en 2004. Reduce <k2, list(v2)> list (<k3, v3>)
MapReduce opera de forma análoga a
La principal ventaja de MapReduce es que UN EJEMPLO como se realizan los censos de población:
facilita el procesamiento paralelo masivo. Veamos un ejemplo sencillo. Asumiendo se despachan agentes a las calles, estos
Definir correctamente las tareas de map() que tenemos cinco archivos, y cada ar- visitan las casas haciendo el conteo en
y reduce() es algo no necesariamente chivo contiene listas de datos organizados cada una, y regresan los resultados que
trivial, pero una vez que se logra esto se en dos columnas (una llave y un valor) que son concentrados para obtener la pobla-
puede repartir la carga de trabajo hacia representan una ciudad y una tempera- ción del área estudiada. Es mucho más
cientos o miles de nodos de procesamiento tura registrada en dicha ciudad. El conte- rápido tener múltiples agentes trabajando
de forma sencilla y transparente. nido de un archivo podría ser el siguiente: en paralelo (por ejemplo uno en cada ca-
lle) que tener un solo agente que recorra
EL ALGORITMO México, 20 todas las casas de forma serial.
Un programa MapReduce se ejecuta en Lima, 25
tres etapas: map, shuffle y reduce. Bogotá, 22
Buenos Aires, 32
Map: En esta etapa se toman los datos a México, 4
partir de una entrada y se procesan línea Buenos Aires, 33
por línea por la función de mapeo. Ésta Bogotá, 18
procesa los datos y los organiza en grupos. Referencias
Los datos que genera como salida están Lo que queremos encontrar es la máxima [1] IBM - What is Map Reduce? http://swgu.ru/ra
en forma de tuplas de pares llave-valor. temperatura para cada ciudad a través [2] Tutorialpoint: Hadoop - MapReduce. http://swgu.ru/rb

Pedro Galván Kondo es cofundador y director editorial de Software Guru.

050 SG.50
SG.COM.MX 051
O HARDWARE

HOLOLENS DEVELOPMENT EDITION

Los desarrolladores interesados en construir aplicaciones


para HoloLens ya pueden adquirir el kit para desarrolla-
dores. A diferencia del Oculus Rift, que requiere estar co-
nectado a una computadora, HoloLens es un dispositivo
autocontenido y soberano. Sus lentes cuentan con un me-
canismo de proyección de imágenes holográficas, de ma-
nera que cuando el usuario ve a través de estos percibe los
hologramas como una capa de realidad aumentada. HoloLens cuenta con diversos sensores, 4 micrófonos y 6 cámaras, incluyendo un sen-
sor de profundidad, a través de los cuales percibe el mundo alrededor del usuario. HoloLens cuenta con dos unidades de procesamiento: un
procesador Intel de 32 bits de propósito general, y un procesador holográfico diseñado por Microsoft con este propósito específico. Ahora
que ya te emocionamos, podemos darte los detalles no tan agradables. El primero es que este kit tiene un precio de 3,000 dólares, así que
no es para cualquiera. Adicionalmente, para desarrollar se requiere una PC con Windows 10, Visual Studio 2015 y Unity 5.4.

AXIS VIDIUS

El Vidius es un dron creado por la empresa


Axis Drones pretende ser el dron más pe-
queño del mundo con vista en primera per-
sona (y hasta donde sabemos, lo logra). Este
cuadricóptero mide tan solo 4.3 cm x 4.3 cm
x 2.5 cm y es capaz de volar hasta a 30 me-
tros de distancia mientras graba y transmite
video por streaming. Cuenta con una cámara
de 1 megapixel que captura video con cali-
dad 480p, lo cual no es nada grandioso pero
puede ser suficiente para cosas sencillas.
Vidius se conecta por WiFi a tu smartphone 3

Android o Apple para que puedas controlarlo,


y cuenta con una batería de 150 mAH que le RASPBERRY PI 3 MODEL B
da 5 minutos de vuelo.

La comunidad maker fue gratamente sorprendida con el lanzamiento del


Raspberry Pi 3 Model B, apenas un año después de haber lanzado el Pi 2. La prin-
cipal mejora del Raspberry Pi 3 es que usa un procesador de 64 bits ARM Cortex
A53 con una velocidad de reloj de 1.2 GHz, lo cual lo hace hace cerca de 50%
más rápido que el Pi 2. Adicionalmente, el Pi 3 ahora tiene integrada conectivi-
dad WiFi 802.11n y Bluetooth 4.0, por lo que podrás conectar teclados y mouses
inalámbricos sin necesidad de habilitar accesorios extra. La memoria RAM se
mantiene en 1 GB y las capacidades de video también se mantiene en VideoCore
IV, aunque ahora operando a 400 MHz. Lo mejor de todo esto es que el Pi 3 tiene
el mismo precio que su predecesor, 35 dólares. Así que si tenías pendiente com-
prarte un Pi, este es el momento.

052 SG.50
HARDWARE
O

4 ROBOHON
Visto en @geek_mx

¿Siempre quisiste tener tu propio y fiel androide? Pues tus plegarias han sido
escuchadas. RoBoHon es un pequeño robot de 7 pulgadas desarrollado por
Sharp el cual hace llamadas, recibe e-mails, descarga aplicaciones e, incluso,
baila al ritmo de tu música favorita. Por si esto fuera poco, dicho dispositivo
también cuenta con un proyector en el que puedes ver tus fotos y películas.
Aparentemente, RoBoHon no es simplemente un smartphone con apariencia
de robot; sino que realmente se encuentra diseñado para funcionar como un
pequeño mayordomo computarizado.

Humor

HP ZBOOK STUDIO

HP recientemente lanzó la 3er generación de su línea de es-


taciones de trabajo móviles ZBook, y debemos confesar que
estamos perdidamente enamorados del nuevo modelo ZBook
Studio. Parece ser que reúne todo lo que los usuarios avanza-
dos hemos deseado desde hace años: una estación de trabajo
portátil que ofrezca el más alto desempeño de procesamiento,
pero que al mismo tiempo sea elegante y verdaderamente por-
tátil. Por fuera, la ZBook Studio es una computadora elegante
y delgada (18 mm), con una pantalla de 15.6’’ con dos opcio-
nes de resolución: 1080p o 4K. Pero la discreción queda sola-
mente por fuera, porque por dentro la ZBook es un monstruo:
puede tener procesador Intel Core i7 o Xeon E3, dos unidades
de disco para ofrecer hasta 2 TB de almacenamiento, hasta
32 GB de RAM DDR4 a 2133 Mhz, tarjeta de video NVIDIA
Quadro M1000M con 4 GB de memoria dedicada, y dos puer-
tos Thunderbolt. Adicionalmente, la ZBook Studio fue dise-
ñada para satisfacer especificaciones militares STD 810G de
resistencia a golpes y condiciones extremas.

SG.COM.MX 053
R RETROSPECTIVA

¿Cómo Llegamos Aquí?


Preparar el número 50 de Software Guru, inevitablemente nos 4. Julio 2005
ha llevado a la nostalgia. Y esa nostalgia nos llevó a preguntarnos.
¿Cómo han cambiado las cosas en nuestra industria y profesión Los sistemas BPM (Business Process
durante el tiempo en que se han publicado estos 50 números? Management) se basan en el concepto
(poco más de 11 años). de modelar visualmente procesos de
negocio y utilizar motores de workflow
Presentamos a continuación un análisis cronológico relacionando para automatizarlos. Actualmente toda-
los temas principales de SG durante sus primeros 3 años, con lo vía existen y mantienen su nicho.
que vemos hoy en día.

0. Octubre 2004 5. Septiembre 2005

El número de estreno de SG se enfocó Antes de los smartphones, el iPhone, las


en la industria de software en México app stores y todo lo demás, ya había dis-
y el recién horneado programa ProSoft. positivos de cómputo móvil (¿se acuer-
Hanna Oktaba participó como colum- dan de las Palm Pilot?), y SG estuvo ahí
nista desde entonces. Desde este para guíarnos a desarrollar aplicaciones
número ya hablábamos de Usabilidad (todavía no se llamaban “apps”).
del software.

1. Enero 2015 6. Noviembre 2005

La fiebre de los modelos formales de ¿Qué es la mejora de procesos de soft-


madurez de procesos estaba a todo lo ware y con qué objetivos deberíamos
que daba, así que desarrollamos una establecer una iniciativa de este tipo? En
guía para explicar las características este número apareció nuestra primera
distintivas de los principales modelos de encuesta de salarios, que se convertiría
procesos. Fue el primer número con Luis en referencia de la industria.
Cuellar como columnista.

2. Marzo 2015 7. Enero 2006

El concepto de “fábricas” o Centros de Hace 10 años no había big data; había


Desarrollo de Software se hace popular, OLAP (Online Analytical Processing)
y estudiamos este modelo. y su paradigma de cubos de datos.
Estrenamos la columna de UML a
Entrevistamos a Blanca Treviño, CEO de cargo de nuestros amigos de Milestone
Softtek, quien ya era reconocida pero no Consulting (hoy Abiztar) que continúan
con el alcance que tiene hoy. apoyando a SG.

3. Mayo 2015 8. Marzo 2006

El software libre todavía luchaba por ser Criptografía, modelado de amenazas,


reconocido como una postura válida. transferencias de datos seguras, y utili-
Hoy es el común denominador e incluso zación de biometría.
Microsoft está haciendo .Net software
libre. En este número, Luis Vinicio León, Entrevista con el mismísimo Jon “maddog”
Raúl Trejo y Luis Daniel Soto iniciaron su Hall cuando vino a ExpoLinux que se hizo
participación como columnistas. junto con ExpoComm (ya llovió).

054 SG.50
RETROSPECTIVA
R

9. Mayo 2006 14. Marzo 2007

Érase una vez que los métodos ágiles Más allá de la evolución (o falta de) que
eran vistos como algo revolucionario y han tenido los lenguajes de programa-
utópico. El método más conocido (aun- ción en la última década, el toolchain de
que no por ello más usado era eXtreme herramientas de control de configuración
Programming), e iniciaba algo llamado y ensamble de aplicaciones ha avan-
Scrum que parecía tener futuro. zado enormemente. Fue en este número
cuando le dedicamos atención a esto.

10. Julio 2006 15. Mayo 2007

Las aplicaciones empresariales (ERP) no Durante la primera mitad de la década


son lo más glamoroso de nuestra profe- de los 2000, eran pocas las empresas
sión, pero no podemos ignorarlas. Visual que hacían desarrollo offshore (nears-
Studio pasa de ser un IDE, a una suite de hore) desde Latinoamérica, pero en la
desarrollo colaborativo. Hablamos por segunda mitad esto se incrementó drás-
primera vez de arquitectura orientada a ticamente, y hoy es de lo más común.
servicios (SOA).

11. Septiembre 2006 16. Julio 2007

Hace tiempo, cuando todavía descono- La primer generación de la web fue


cíamos la existencia de los hipsters y unidireccional, había una clara división
nadie se atrevía a usar corbatas de moño, entre productores y consumidores de
hablamos sobre usabilidad y user expe- contenido y la comunicación solo iba en
rience. También, la guerra entre “javeros” y un sentido. Luego llegaron las wikis, los
“dotneteros” era intensa, y publicamos un sitios de upvoting, las redes sociales, y
comparativo entre estas plataformas. todo cambió.

12. Noviembre 2006 17. Septiembre 2007

El testing de software es parte esen- Todavía no se utilizaba el término


cial del desarrollo de software. Sin “Internet de las cosas”, pero ya se vis-
embargo, no hace tanto que se le lumbraba la oportunidad usar software y
comenzó a profesionalizar en nuestra sensores para dotar de cierta inteligen-
región. Esta fue una de las primeras cia e interactividad a dispositivos físicos.
ocasiones en las que lo abordamos El protocolo de comunicación Zigbee
formalmente. tomaba fuerza y publicamos al respecto.

13. Enero 2007 18. Noviembre 2007

En el mundo pre-iPhone, eran muy pocos Publicamos sobre una nueva tecnolo-
los que tenían la suerte de poder desa- gía llamada Ruby on Rails que ganaba
rrollar videojuegos, debido al costo de las popularidad. No imaginábamos que este
herramientas y las dificultades de distri- inocente framework desencadenaría
bución. Afortunaamente, hoy herramien- una ola de lenguajes dinámicos y fra-
tas como Unity lo hacen más sencillo, y meworks automágicos, así como el sur-
las app stores resuelven distribución. gimiento del desarrollador hipster.

SG.COM.MX 055
O BIBLIOTECA

THE ANALYTICS REVOLUTION: HOW TO IMPROVE YOUR


BUSINESS BY MAKING ANALYTICS OPERATIONAL
1
IN THE BIG DATA ERA
Bill Franks. Wiley, 2014.

The Analytics Revolution está dirigido principalmente a gerentes y directi-


vos interesados en establecer una práctica exitosa de analítica de datos en su
organización.

A lo largo del libro se abordan distintos aspectos, tales como:

• Panorama de qué es la analítica operacional y las tendencias que nos han


llevado hasta aquí.
• Cómo estructurar un equipo de analytics que cubra roles de análisis,
desarrollo e infraestructura.
• Cómo cambiar la cultura corporativa para habilitar el descubrimiento de
información basado en analítica y la reducción de tiempos para implementar
mejoras basadas en la información descubierta.
• Guías sobre cómo justificar, implementar y gobernar una práctica de
analítica.

El autor, Bill Franks, es director de analytics en la empresa Teradata, así que tiene
bastante experiencia en el tema, así como exposición a casos reales en organi-
zaciones complejas.

WEB DEVELOPMENT RECIPES, 2ND EDITION. 2


Brian Hogan, Chris Warren, Mike Weber, Chris Johnson.
Pragmatic Bookshelf, 2015.

El desarrollo web está en constante evo- • Estilizado visual: estilizado de


lución, y los desarrolladores requieren botones, animaciones con CSS3, íconos
mantenerse al tanto de las más recien- tipográficos.
tes técnicas y tecnologías. El propósito • Interfaz de usuario: handlebars tem-
de Web Development Recipes es justa- plating, paginación sin fin, knockout.js,
mente ayudar a los desarrolladores web React, Angular.
a mantener actualizado su repertorio de • Datos: agregar mapas en línea, datos
herramientas. cross-site con JSONP, widgets.
• Móvil: menús drop-down responsi-
La primera edición de Web Development vos, drag and drop en móviles.
Recipes se publicó a principios de 2012, • Workflow: diseño responsivo con
y esta 2da edición se publicó en julio Skeleton, SaSS, Git.
de 2015, así que está bastante fresca • Testing: Selenium, Nightwatch,
y aborda herramientas como Vagrant, Jasmine.
Grunt, Angular y React. • Ambiente de ejecución: despliegue
con Grunt, configuración de máquinas
El libro está organizado de acuerdo a tipos virtuales con Puppet.
de recetas. A continuación listamos las
secciones y principales recetas:

056 SG.50

También podría gustarte