Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Datos
—
1 © RED SUMMA
Fundamentos del Análisis de Datos
Índice
1 Introducción ............................................................................................................................................................ 3
2 Hacer las Preguntas Correctas y Obtener la Respuesta .............................................................. 3
3 Decisiones Basadas en la fe vs Decisiones Basadas en los Datos........................................ 6
4 Las Buenas Métricas .......................................................................................................................................... 7
5 El Proceso del Análisis de Datos ............................................................................................................... 8
6 Datos Absolutos y Datos Relativos .......................................................................................................... 8
7 El Volumen de los Datos ................................................................................................................................ 9
8 La Media y la Mediana .................................................................................................................................... 11
9 Técnicas de Análisis de Métricas ............................................................................................................. 12
10 Conclusiones ............................................................................................................................................... 15
11 Bibliografía Esencial ......................................................................................................................................... 15
02 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
Objetivos
Entender la analítica como herramienta al servicio de la toma de decisiones.
Conocer la naturaleza de los datos y el tipo de análisis que se puede hacer con
ellos.
1 Introducción
Tenemos tendencia a fiarnos ciegamente de los datos, sin entender bien qué significan
y podemos llegar a conclusiones erróneas si no se tiene cuidado.
Un día tu jefe te pregunta: ¿Cuántas visitas tiene la página web? ¡Por fin se ha interesado!
Vas corriendo al Google Analytics a darle la respuesta, pero…
¿Qué quería decir el jefe por las visitas que tiene la página web?
Sesiones
Usuarios únicos
Páginas vistas
Google Analytics también nos pedirá un intervalo de tiempo. Nuestro jefe podría querer
los datos de:
Hoy
03 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
El último mes
El año pasado
Desde siempre
Volvemos al despacho del jefe y le preguntamos. ¿Deseas los datos de las sesiones de
los últimos 30 días? Nos dice sí.
El jefe nos responde: No entiendo bien ese dato. No puedo saber si es un buen
resultado o un mal resultado… además, ¿Qué son exactamente las sesiones? Yo quiero
saber cuántas visitas ha habido.
Deberemos explicarle al jefe qué es una sesión y por qué le sugerimos esa métrica y
además deberemos decirle si 1.000 sesiones son buenas o malas. Para ello podríamos
compararlos con las sesiones del mes pasado o del mismo mes del año pasado.
(mes pasado)
2. están aumentando
3. los últimos 3 meses las sesiones están por encima de los valores de la media
anual.
Pero tu jefe tiene otra pregunta más: ¿Por qué no han aumentado las ventas de la web
en los últimos 3 meses?
La respuesta natural e ingenua sería: “La probabilidad de que una visita rellene un
formulario está medida por la tasa de conversión. Como bien sabemos, la tasa de
conversión de la web ha sido siempre del 4% aproximadamente.”
04 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
Por tanto, si hemos tenido 1000 visitas (sesiones) deberías tener 40 formularios rellenos
este mes de marzo. Seguramente el equipo de ventas no esté haciendo bien su trabajo.
(mes pasado)
Formularios de 20 18 21 20
contacto
Es evidente, a la luz de los datos que algo va mal. La regla de que tasa de conversión
de nuestra web es del 4% no nos funciona. Aunque el tráfico a la web está aumentando,
no lo hacen las oportunidades de venta, que están siempre en los mismos valores.
Formularios de contacto 16 5 0
Parece que el culpable de que aumente el tráfico pero que no aumenten las ventas la
tiene una campaña publicitaria contratada a popads.net que trae muchas visitas, pero
poca intención de compra. (Popads es conocido entre los expertos black-hat SEO por
ser un portal del que se obtiene tráfico barato de mala calidad.)
Al poner los datos en contexto, hemos podido saber qué iniciativa de marketing no
Es preferible usar métricas sencillas para funciona y hemos podido prescindir del gasto en popads.net.
analizarlas en su contexto.
Además, podemos decirle a nuestro jefe, que siga invirtiendo en Google, porque,
aunque tiene una tasa de conversión menor que el tráfico directo, supone 16 de las 21
oportunidades de venta totales.
05 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
También podremos concluir que el tráfico directo es el más eficiente y debemos invertir
en conocimiento de marca (branding), para aumentarlo.
La analítica está al servicio de la toma de decisiones. De nada nos vale una métrica sin
contexto o una métrica que no entienda la persona que la va a leer.
Google Analytics
Piwik
Omniture
Logs: Son ficheros que el servidor web guarda con los detalles de las peticiones
http y https que recibe y atiende.
06 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
Una buena comprensión de los datos, nos permitirá saber que estamos tomando la
decisión acertada y el nivel de confianza con el que jugamos a la hora de hacer
argumentos o aseveraciones.
Relevante: Tiene que estar alineada con los objetivos del negocio. Si el objetivo
es comunicar un mensaje, una buena métrica podría ser el tiempo medio en la
página, pero si el objetivo es vender, una mejor métrica sería el número de
carritos de la compra abandonados.
07 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
Te dice cuanta gente visitó tu página, no le gustó lo que vio y se fue por donde vino y
es:
Sencilla de entender.
Tomamos decisiones.
08 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
Los valores relativos nos dan una noción de la eficiencia y por tanto sirven para
comparar métricas con volúmenes diferentes.
Aunque tenga 100 visitas de tráfico de Facebook y 1.000 de google.com siempre podré
saber cuál es más eficiente mirando la tasa de conversión.
No sería adecuado inferir que el tráfico de google.com es más eficiente respecto de las
conversiones, porque, aunque sean 20 conversiones, sólo soy capaz de convertir el 2%.
Pero jamás me plantearía dejar de invertir en google sin probar antes qué tal funciona
Facebook. Podría ser que Facebook no fuera capaz de generarme más de 300 visit as y
sólo podría obtener 15 conversiones y renunciaría a las 20 conversiones que sí me está
dando ya Google.
Hemos visto ya que los datos relativos sirven para comparar la eficiencia de un valor
Es muy peligroso fiarse de los absoluto cuando tenemos volúmenes distintos. Pero… ¿me puedo fiar de todos los datos
porcentajes. Podrían representar pocos relativos?
datos y por tanto no ser representativos
de lo que queremos analizar.
09 RED SUMMA®
Not a Técnica preparada por l a Red Summa. Su dif usión, reproducción o uso t ot al o parcial par a
cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados
Fundamentos del Análisis de Datos
Clicks en el anuncio
CTR = ∗ 100 (%)
Impresiones del anuncio
Caso A 20 1 5%
Caso B 100 5 5%
Caso C 500 25 5%
Los tres casos, tienen un CTR del 5% pero la calidad de estos datos no es la misma.
Caso A 21 2 9,52%
Como podemos ver, los datos relativos cambian mucho si son relativos a volúmenes
pequeños y se mantienen muy parecidos si son relativos a volúmenes grandes de datos.
Si me preguntan cuál es el CTR del caso C diré que del 5% con mucha seguridad.
No podemos determinar el CTR con fiabilidad cuando sabemos que, con la próxima
impresión, podría casi duplicar su valor.
8 La Media y la Mediana
¿Cuál es mi peso?
La mediana es el resultado de ordenar los valores y tomar el valor del centro. En el caso
de que sean pares, será la media de los dos valores centrales.
Ordeno los 3 datos. En este caso ya están ordenados en orden creciente y no hay
que recolocar los valores.
Tomo el valor del centro. En este caso el segundo que se corresponde con la
pesada 2.
Este valor es muy robusto. Si añadiésemos pesadas, no variaría mucho puesto que
iríamos añadiendo pesadas mayores y menores en torno a la mediana y sólo nos
fijaríamos en el valor central.
Cuando tenemos pocos datos, nos interesa conocer la mediana, pero los sistemas de
analítica web sólo trabajan con medias por tanto tenemos un problema. No tendremos
datos buenos hasta que tengamos muchos.
Nuestra capacidad de análisis está muy mermada porque llenamos nuestros paneles
Las medias y porcentajes deben servir para de control e informes de métricas que trabajan en nuestra contra.
saber dónde debemos profundizar. Este
epígrafe explica cómo profundizar. Estas técnicas de medida son:
Medias
Porcentajes
Métricas compuestas
El atractivo de trabajar con medias es el de resumir todos los datos en un único valor.
Identificamos los segmentos más importantes y calculamos la media para cada uno de
esos segmentos.
Google 32s
Popads.net 12s
Cuando tenemos un informe con porcentajes necesitamos filtrar para encontrar los
datos buenos y malos.
Por ejemplo. Tengo un informe con muchísimas palabras clave como este ordenando
por visitas:
Me gustaría saber qué palabras me dan más tasa de rebote y qué palabras me dan
menos tasa de rebote. El problema es que siempre serán las palabras de 1 visita las que
me den el 0% y el 100% y no podré ordenar los resultados por tasa de rebote.
Abogados Chapinería 1 0%
Resulta que de entre todas las visitas que hubo en la web sólo hubo una para
“abogados chapinería” y el visitante se quedó en la web y no originó un rebote.
Este dato no es relevante porque no vamos a optimizar una página con una visita por si
acaso dentro de 3 meses viene otro visitante.
Antes de ordenar, debemos siempre excluir los resultados poco relevantes. En este
caso las páginas que tengan menos de 100 visitas y luego ordenar.
Podemos también segmentar los datos igual que hacíamos con las medias.
Métricas compuestas
Una métrica compuesta es una métrica cuyos subcomponentes son otras métricas.
El problema de las métricas compuestas es que ocultan los principios subyacentes que
intentamos medir y por tanto nos dan datos con los que no podemos hacer nada.
Donde,
a = %descargas
Esta métrica es tan complicada que incluso aunque pudieras explicársela a otra
persona y ésta entendiera lo que significa, tardaríais mucho tiempo analizando el valor y
extrayendo conclusiones simplemente porque es más complicada de entender.
Sin embargo, podríamos trabajar con las métricas a, b, c, d y e por separado para poder
explicar lo mismo de una manera más clara.
10 Conclusiones
Debemos usar métricas que todos los que vayan a leer los informes puedan
entender sin esfuerzo.
11 Bibliografía Esencial
http://webanalysis.blogspot.com/2010/06/compound-metrics-in-web-
analytics.html