Está en la página 1de 28

Fundamentos de la recolección

de datos online
Aprende las bases de la recolección de datos online

© netquest 2017
Tabla de contenidos

Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Internet ha cambiado la investigación de mercados. . . . . 4

Fuentes para obtener muestras online. . . . . . . . . . . . . . . . . 6

Métodos de muestreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

El muestreo por cuotas online efectivo . . . . . . . . . . . . . . . . 14

Planificar la recolección de datos online . . . . . . . . . . . . . . . 17

Encuestas eficaces para el trabajo de campo online. . . . . 19

Datos de calidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Privacidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Reporting y visualización. . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Introducción
Este Ebook pretende ser una guía para implementar
una recolección de datos online eficaz para la
investigación de mercados.

La recolección de datos es la actividad que empieza una vez se han definido el objetivo y el diseño
de la investigación, y acaba cuando se dispone de los datos recogidos para proceder a su análisis.
En este contexto, «efectivo» significa encontrar el equilibrio entre costes, tiempo y calidad.

Este Ebook te puede interesar si te identificas con alguno de los siguientes perfiles:

1. Eres un profesional con experiencia en la investigación de mercados y llevas años


trabajando con metodologías convencionales para la recolección de datos, como las
entrevistas personales y las entrevistas por teléfono. Te ves obligado a investigar y aplicar
nuevas tecnologías para satisfacer las peticiones de tus clientes o ser más eficiente. Aunque
tengas experiencia en la recolección de datos online, este libro te ayudará a entender las
diferencias principales entre los distintos métodos y te permitirá decidir mejor a la hora de
elegir qué métodos aplicas y cuándo.
2. Eres joven y te dedicas profesionalmente a la investigación de mercados. La
investigación de mercados online ha sido tu elección natural desde que empezaste tu
andadura profesional, pero crees que hay una gran diferencia entre lo que te enseñaron
en clase y la vida real. Te preguntas cómo poner en práctica los conocimientos aprendidos
sobre muestreo probabilístico, los marcos muestrales y las cuotas en proyectos reales. O
quizás te apetece conocer las novedades que se han producido desde que acabaste tus
estudios.
3. Actualmente, estudias técnicas de investigación de mercados. Crees que el marco
teórico que estás aprendiendo dista enormemente de la recolección de datos real. Quieres
entender cómo emplear mejor los conceptos clásicos que aprendes en un mundo cada vez
más dominado por la tecnología, la flexibilidad y la velocidad.
4. No te dedicas profesionalmente a la investigación de mercados, pero en tu trabajo
tienes que recolectar datos online y quieres saber cómo hacerlo de forma rápida y eficaz.

Con este libro quiero tender un puente importante entre la teoría y la práctica de forma sencilla,
breve y directa. Este libro es tan solo una guía; en él no se tratan todos los temas con gran
profundidad, pero te ayudará a descubrir aquellas incógnitas que todavía no conoces. Encontrarás
más información en nuestro blog en www.netquest.com.

Por último, permíteme una observación final acerca del objetivo de este libro: las
recomendaciones del libro son aplicables a prácticamente todas las metodologías de recolección
de datos online cualitativas y cuantitativas, pero nos centraremos en las encuestas por tratarse de
la metodología de investigación de mercados más habitual.

Fundamentos de la recolección de datos online 3


Internet ha cambiado la
investigación de mercados

Las nuevas tecnologías han creado un nuevo comportamiento del consumidor y la necesidad
de estudiar este nuevo comportamiento en su contexto. Paralelamente, las nuevas tecnologías
han dado lugar a nuevas formas de recolectar información sobre el comportamiento de los
consumidores. Desde el auge de Internet a mediados de los 90, la investigación de mercados se ha
volcado en la recolección de datos online.

Cada día son más las investigaciones que se realizan a través de dispositivos con conexión a
Internet. Además, los nuevos dispositivos nos permiten recolectar nuevos tipos de datos. ¿Qué
razones nos empujan a recolectar datos a través de Internet? ¿Qué ventajas nos aportan? ¿Hay
límites?

Fundamentos de la recolección de datos online 4


Internet ha cambiado la investigación de mercados

La siguiente tabla recoge las ventajas y los inconvenientes de la recolección de datos online en
comparación con los métodos tradicionales.

VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS ONLINE

Ventajas Inconvenientes

Menos costes debido a la ausencia Parte de los costes ahorrados en el


Costes del entrevistador. entrevistador deben destinarse a
recompensar a los participantes.

Más rápida que los métodos offline. L os proyectos más complejos


Recolección de datos automatizada seguirán requiriendo más tiempo
y un grupo más grande de de lo que cabría esperar si, por
encuestados potenciales. ejemplo, el tamaño de la muestra es
Velocidad
muy grande, si es difícil acceder a la
población objetivo o si aplicamos un
muestreo por cuotas complejo (véase
más adelante).

En función del país, mejor En muchos países, la población


acceso a determinados grupos online no representa la totalidad de
Representatividad sociodemográficos, como la gente algunos grupos sociodemográficos,
joven o las personas con estudios como la gente mayor o las clases más
superiores. bajas.

En la recolección de datos online se Este aspecto no presenta


pueden utilizar todos los estímulos inconvenientes. La modalidad
imaginables: imágenes, vídeos, audios, online es claramente mejor a nivel
Estímulos
mapas interactivos, simuladores de de variedad de herramientas que
compra y cuestionarios conjuntos. se pueden utilizar para recolectar la
información.

Debido a la ausencia del La calidad depende de los


entrevistador, menos riesgo de entrevistados. Algunos riesgos son
Calidad respuestas fraudulentas o sesgos la duplicación de participantes,
inducidos. participantes fraudulentos o la falta
de atención.

Se recoge, procesa y, dado el Algunos métodos de recolección de


caso, visualiza en tiempo real y datos offline requieren consolidar y
Procesamiento de simultáneamente la información procesar los datos antes de pasar al
procedente de varios encuestados. Es reporting y la visualización. En estos
datos fácil y rápido. casos, no es posible aprovechar al
máximo la velocidad que caracteriza
la recolección de datos online.

Fundamentos de la recolección de datos online 5


Fuentes para obtener
muestras online
Todos los procesos de recolección de datos empiezan por
el muestreo, que es el método empleado para elegir un
subgrupo de individuos de un universo estadístico con el fin
de estimar las características de todo el universo.
Existen varios métodos de muestreo: algunos son más prácticos que otros, en función de los
objetivos que persigamos con nuestra investigación y el universo objetivo. Pero, antes de aplicar
cualquiera de estos métodos, pregúntate: ¿Dónde puedo encontrar participantes online para una
encuesta online?

Gran parte de los métodos de muestreo que te han enseñado no son aplicables a la mayoría de
proyectos de investigación, independientemente de si recoges datos online u offline: ¿Cuántas
veces en la vida podrás utilizar un muestreo probabilístico puro? Esto es especialmente importante
cuando utilizamos Internet.

Mi primer consejo: olvídate de cómo te gustaría alcanzar tu muestra, piensa en cómo puedes
alcanzarla y alinea tu enfoque con la realidad. El muestreo online presenta ciertos retos: la
población en Internet no está censada y no puedes interceptar a personas al azar para pedirles
que participen, como a pie de calle. Intenta entender cómo funciona Internet y encuentra la
solución que mejor se adapte a tu proyecto de recolección de datos online; no lo hagas al revés.
Este libro te ayudará a conseguirlo.

Actualmente, los investigadores profesionales emplean cuatro fuentes distintas para conseguir
participantes.

1. Paneles de acceso online

Los paneles de acceso online son comunidades online formadas por personas predispuestas a
participar en proyectos de investigación de mercados (encuestas, en su mayoría) a cambio de una
recompensa, como dinero, obsequios, donaciones o sorteos.

Los paneles de acceso online reclutan a sus miembros por distintas vías. Algunos son paneles
abiertos en los que los participantes se registran simplemente entrando en su página web. Se
capta la atención de los visitantes a través de campañas de publicidad públicas y se convierten en
nuevos miembros.

Otros paneles son cerrados y solo se puede acceder a ellos con una invitación personal enviada a
los miembros registrados en páginas web asociadas. Pueden parecerse a los paneles abiertos, pero

Fundamentos de la recolección de datos online 6


Fuentes para obtener muestras online

no lo son, ya que no es posible acceder a un panel cerrado sin invitación.

Actualmente, los paneles de acceso online conforman la fuente principal de participantes en la


investigación de mercado profesional.

2. River sampling

El river sampling (muestreo en río) es un método inspirado en el funcionamiento de las encuestas


cara a cara, esto es, interceptando a personas en la calle. El river sampling intenta interceptar a las
personas online cuando navegan por Internet. ¿Cómo? Con anuncios en páginas web con mucho
tráfico como Google o Facebook. Sin embargo, en lugar de pedir a la gente que acceda a un panel
para participar en futuras encuestas, como sucede en un panel online, se les pide que participen
directamente en una sola encuesta online. A cambio, reciben una recompensa para premiar su
participación.

3. Paneles online probabilísticos

Es difícil crear un panel que sea totalmente representativo de la población reclutando a personas
online. En realidad, es imposible, principalmente por 2 razones: (1) en muchos países, una parte de
la población no utiliza Internet y (2) no hay un directorio que recoja todos los usuarios de Internet
a partir del cual se puedan elegir personas al azar. Tal y como veremos más adelante, estos límites
nos impiden utilizar el muestreo aleatorio.

Los paneles probabilísticos intentan superar estas dificultades reclutando a personas offline y
ofreciendo un dispositivo con conexión a Internet a aquellas que no utilizan Internet. De este
modo, es posible utilizar el método de muestreo probabilístico clásico para crear el panel online.
Una vez tenemos el panel, las muestras aleatorias que se extraen deberían ser muestras aleatorias
de todo el universo. Así, nos aseguramos de tener un panel representativo.

Por norma general, los paneles online probabilísticos son más pequeños y resultan más caros
que los paneles de acceso online y se suelen utilizar, fundamentalmente, para la investigación
académica.

4. Bases de datos de propiedad

Si disponemos de una base de datos con correos electrónicos o cualquier otra forma de
contactar a la gente por Internet cuando nos convenga, tenemos una buena oportunidad para la
recolección de datos online. En función del objetivo de la investigación, es probable que no sea
necesario representar a toda la población, sino únicamente a nuestro grupo objetivo, por ejemplo,
nuestros clientes o visitantes. La representatividad no siempre es un problema.

La tabla a continuación muestra las ventajas y los inconvenientes principales de las distintas
fuentes de datos.

Fundamentos de la recolección de datos online 7


Fuentes para obtener muestras online

VENTAJAS E INCONVENIENTES DE LAS FUENTES ONLINE DE PARTICIPANTES

Ventajas Inconvenientes

• Flexibilidad: apto para todo tipo de • Los paneles no siempre están


proyectos de recolección de datos. disponibles en las zonas menos
pobladas.
• Estabilidad: permite predecir y
planificar con precisión el número • Representatividad limitada. El
de participantes. muestreo por cuotas debe aplicarse
correctamente para superar esta
• Apto para estudios de seguimiento
dificultad
en los que se debe llegar a la misma
Online Access población objetivo periódicamente.
Panel • Coste moderado, incluso para los
targets difíciles de acceder (siempre
y cuando el panel se haya perfilado
correctamente).
• Permite implementar medidas
de calidad comparando la
participación de los individuos a lo
largo del tiempo.

• Bajo coste. • Problemas de calidad: no es fácil


monitorizar a los participantes para
• Apto para países con poca
evitar identidades fraudulentas
población cuando no disponemos
o malas conductas durante la
de un panel de acceso online.
participación.
• Buena fuente de públicos online
frecuentes, como los adolescentes. • No apto para estudios de
River sampling seguimiento: los resultados de
la muestra son inestables en el
tiempo.
• Riesgo de obtener resultados
sesgados cuando se invita a todos
los participantes desde la misma
página web.

Fundamentos de la recolección de datos online 8


Fuentes para obtener muestras online

• Buena representatividad. El • Tamaño limitado.


muestreo por cuotas no es tan • Costes elevados.
Paneles online crítico como en los paneles de
acceso online. • No disponible en la mayoría de
probabilísticos
países.
• Alta estabilidad, se pueden predecir
los resultados de las muestras.

• El menor coste posible porque • No siempre disponemos de bases


ya poseemos la fuente de de datos de propiedad para
participantes. solucionar nuestros problemas.
• Dependiendo de cómo definamos • Apto para recolectar información
la población objetivo y perfilemos de nuestros clientes, pero no de los
a los participantes en nuestra base clientes de nuestros competidores.
de datos se puede implementar el
Bases de datos de muestreo probabilístico.
propiedad • Los resultados se pueden
complementar con la información
ya disponible (es decir, los
resultados de las encuestas a
clientes se pueden comparar con
los ingresos o la segmentación de
clientes)

Fundamentos de la recolección de datos online 9


Métodos de muestreo
Una vez tenemos una visión clara de las fuentes principales
de participantes para nuestra encuesta, la decisión acerca
del método de muestreo es bastante clara: el método de
muestreo que aplicaremos depende enormemente del
número de participantes disponibles.
Los métodos de muestreo existentes se pueden dividir en 2 categorías: los métodos de muestreo
probabilístico y no probabilístico.

Métodos de muestreo probabilístico


Una muestra probabilística es una muestra en la que cada unidad del universo tiene una
probabilidad (superior a cero) de ser elegido en la muestra y dicha probabilidad se puede
determinar con precisión. Estas características permiten producir estimaciones no sesgadas de los
totales de población. El muestreo probabilístico requiere siempre un marco muestral, es decir, una
lista de todos los individuos de un universo que se pueden incluir en la muestra.

El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo probabilística más habitual, ya


que se considera un estándar de oro: todos los métodos se pueden comparar con él. En el M.A.S.,
los individuos del universo tienen las mismas probabilidades de ser seleccionados. Esta condición
minimiza los sesgos y simplifica el análisis.

Otros métodos de muestreo probabilístico son:


Muestreo estratificado: si el universo presenta distintas categorías o estratos distintos, cada
estrato se puede investigar como subgrupo independiente. Este método (1) permite sacar
conclusiones sobre cada subgrupo y (2) nos ofrece unas estimaciones estadísticas más eficientes
que son, al menos, tan buenas como con el muestreo aleatorio simple y, con frecuencia, incluso
mejores. El muestreo estratificado funciona mejor si la varianza entre estratos es baja dentro de
cada estrato pero elevada entre estratos distintos, de modo que el tamaño de la muestra se pueda
adaptar a cada estrato.

Muestro por conglomerados: cuando la población se puede dividir en grupos o conglomerados


y cada conglomerado es parecido a los demás, podemos realizar el muestreo a partir de uno de
los conglomerados para representar a toda la población. Este planteamiento es práctico si un
menor número de conglomerados reduce los costes de la recolección de datos (por ejemplo, si
cada manzana en una ciudad conforma un conglomerado, podemos reducir costes enviando
entrevistadores a tan solo unas cuantas manzanas). También simplifica el marco muestral: en el
ejemplo anterior, necesitaremos un mapa de las manzanas en la ciudad en lugar de una lista de

Fundamentos de la recolección de datos online 10


Métodos de muestreo

los individuos en la ciudad. El muestreo por conglomerados puede aumentar la varianza entre las
estimaciones muestrales, en especial, si los conglomerados no son homogéneos.

Muestreo sistemático: este método selecciona los individuos en períodos regulares a partir de
una lista ordenada de la población. Por ejemplo, elegimos a 1 visitante entre 50 en una tienda
para entrevistarle. Este método puede igualar o incluso mejorar los resultados obtenidos con el
muestreo aleatorio simple, pero si hay una correlación entre la lista ordenada de candidatos, las
estimaciones resultantes pueden ser sesgadas.

Métodos de muestreo no probabilístico


En pocas palabras, el muestreo no probabilístico es cualquier método de muestreo que no
cumpla los requisitos del muestreo probabilístico, ya sea porque, a veces, no se puede llegar a
algunos individuos de la población objetivo, ya sea porque desconocemos la probabilidad de
inclusión. Aunque muchos lo hacen, no se debe hacer una estimación de errores con los métodos
de muestreo no probabilístico. Las encuestas telefónicas por marcado aleatorio y las entrevistas
personales en zonas urbanas con una amplia concentración de pisada son algunos ejemplos de
métodos de muestreo no probabilísticos.

Lo cierto es que en la investigación de mercados, el 99 % de la recolección de datos utiliza


muestreos no probabilísticos. Por lo tanto, si has valorado una estimación de errores junto con el
resultado de la encuesta (el llamado margen de error y nivel de confianza), has hecho un mal uso
disfrazado del método de muestreo.

Por suerte, esto no significa que el muestreo no probabilístico no sirva para nada. No es perfecto,
no contempla la estimación de errores de medición y puede ser un método ligeramente o incluso
bastante sesgado, pero la información siempre es valiosa en tanto que sepamos cómo se ha
recogido y que, a pesar de sus limitaciones, nos sirve para alcanzar nuestros objetivos.

El muestreo por cuotas es el método de muestreo no probabilístico más habitual. En el muestreo


por cuotas, la población se divide en grupos mutuamente excluyentes conforme a variables de
segmentación como la edad, el sexo o la región. Definimos la distribución de la muestra objetivo
por segmentos de modo que se corresponda con la población objetivo. Así, por ejemplo, si la
población objetivo es un 50 % de hombres y un 50 % de mujeres, una muestra de 1.000 individuos
debe ser equivalente a este reparto: 500 hombres y 500 mujeres.

Una vez definido el tamaño de cada segmento o cuota, elegimos una muestra no aleatoria y
entrevistamos a los individuos hasta alcanzar el objetivo de cada cuota. Esto significa que una
vez he alcanzado los 500 varones, si el siguiente individuo en la muestra es un hombre, tenemos
que descartarlo. Los individuos descartados se denominan «quota fulls». En este sentido, el
muestreo por cuotas se parece al muestreo estratificado, pero en lugar de incluir a los individuos
aleatoriamente en cada segmento, de la muestra no aleatoria cabe esperar que sea lo más
representativa posible llenando las cuotas objetivo por segmento.

Fundamentos de la recolección de datos online 11


Métodos de muestreo

Otros métodos de muestreo no probabilístico son:


Muestreo por bola de nieve: este método empieza identificando un pequeño grupo de
encuestados iniciales dentro de la población objetivo. Los encuestados iniciales se utilizan para
reclutar a más encuestados dentro de la población objetivo. Es un buen método para las muestras
de difícil acceso.

Muestreo por conveniencia: este nombre se utiliza habitualmente para describir cualquier otro
método que persiga obtener fácilmente una muestra no probabilística. Los individuos se registran
voluntariamente en un formulario web. Los seguidores de Facebook son un ejemplo de este tipo
de muestras. No podemos calcular hasta qué punto las muestras representan a nuestro universo
pero son una muestra y, por lo tanto, pueden servirnos para recolectar datos.

Métodos de muestreo aptos para la recolección de datos online.


Tal y como hemos explicado anteriormente, los métodos de muestreo más adecuados para la
recolección de datos dependen de la fuente de participantes que utilicemos.

Si extraemos muestras a partir de un panel de acceso online, la única opción realista es el


muestreo por cuotas. Los paneles de acceso online no son representativos de toda la población,
pero si están bien diseñados, deberían proporcionarnos todo tipo de encuestados. Para
asegurarnos de que extraemos una muestra representativa del panel, debemos fijar las cuotas
correctas. El siguiente capítulo aprenderemos a fijar las cuotas para la recolección de datos online.

Esto también es aplicable al river sampling. En este caso, las cuotas son aún más importantes
debido a la varianza limitada de los participantes.

Pero las cosas son distintas cuando trabajamos con un panel online basado en la probabilidad,
porque se supone que este tipo de paneles conforman una muestra aleatoria/representativa
del universo. En teoría podríamos confiar en esto para extraer muestras aleatorias del panel. Sin
embargo, debemos recordar que un panel online probabilístico sigue siendo una comunidad de
personas encuestadas periódicamente a cambio de algo. Algunos miembros del panel pueden
responder más activamente que otros a las invitaciones. El nivel de actividad puede variar en
función de la edad, el sexo u otros factores sociodemográficos, de manera que, al final, la muestra
del panel puede ser sesgada. El muestreo por cuotas es nuestro mejor aliado para evitar estos
retos.

Fundamentos de la recolección de datos online 12


Métodos de muestreo

Por último, si tenemos acceso a una base de datos de propiedad, podremos utilizar varios
métodos de muestreo. Por ejemplo, pensemos en una lista exhaustiva de clientes de una empresa:
si queremos investigar este target específico, la lista es un marco muestral, de modo que podemos
aplicar métodos de muestreo probabilístico como el muestreo aleatorio simple o el muestreo
sistemático. Obviamente, también podemos recurrir al muestreo no probabilístico.

A veces, la base de datos de propiedad puede conformar un marco muestral o no, dependiendo
de cómo definamos nuestra población objetivo. Por ejemplo, supongamos que tenemos una
lista de clientes y clientes potenciales suscritos al boletín de noticias de una empresa. ¿Es este el
marco muestral? Si definimos nuestra población objetivo como «personas interesadas en recibir
información periódica de mi empresa», entonces sí. Si nuestra población objetivo es «cualquier
cliente real y potencial», entonces no. En el segundo caso, el muestreo por cuotas es siempre una
opción, pero cuando trabajamos con bases de datos internas, a veces es mejor aplicar el muestreo
aleatorio a toda la base de datos y analizar los resultados por segmentos, ya que no hay un coste
creciente por respuesta.

Fundamentos de la recolección de datos online 13


El muestreo por cuotas
online efectivo
El muestreo por cuotas es el método de muestreo por defecto
para recolectar datos online.
Cuando encargamos un proyecto de recolección de datos online a un panel online, nos
preguntarán cómo queremos utilizar las cuotas. A continuación encontrarás las mejores prácticas
y recomendaciones para fijar cuotas y asegurarte así de realizar una recolección de datos online
efectiva.

1. Fija cuotas para variables que (1) sean imprescindibles para tu proyecto y/o (2)
cuya distribución difiera claramente de tu población objetivo y la población de
Internet.

Las cuotas pretenden subsanar la posible falta de representatividad debido a las divergencias
entre nuestra fuente de datos y la población objetivo. Si hemos utiliza el muestreo por cuotas para
recolectar datos offline, deberíamos plantearnos si nos conviene reutilizar las mismas cuotas con
las mismas variables sociodemográficas. Aunque normalmente fijemos las cuotas por sexo, edad y
región, es probable que para la recolección de datos online no nos sirvan.

Veamos algunos ejemplos sobre cómo enfocar las cuotas para el muestreo online:

• En general, la edad es un factor clave en prácticamente todos los países. Los jóvenes
son más propicios a utilizar Internet que las personas mayores, salvo en los países más
desarrollados, como Noruega o Suecia, que registran una penetración de Internet del 95 %
aproximadamente.

• A pesar de que en la mayoría de países el uso de Internet no difiere demasiado entre


hombres y mujeres, cuando extraemos muestras de paneles de acceso online tenemos que
utilizar cuotas por sexo. Esto se debe a que los paneles tienen que ser lo suficientemente
grandes para satisfacer las necesidades de los compradores investigados y se suele investigar
más a las mujeres que a los hombres porque se asume que las mujeres toman más
decisiones de compra relacionadas con el hogar. Si no fijamos cuotas por sexo, es probable
que recibamos más respuestas de mujeres.

• En países menos desarrollados en América Latina, Asia y África, la clase social es un


factor decisivo. El uso de Internet varía enormemente entre clases sociales. Además, las
clases sociales más bajas tienen un comportamiento totalmente distinto al de las clases
medias y altas. En países desarrollados, esto no suele ser tan importante, así que podemos
ahorrarnos este control de cuotas.

Fundamentos de la recolección de datos online 14


El muestreo por cuotas online efectivo

2. Menos es más: utilizar el número mínimo de cuotas.

Las cuotas hacen que el proceso de recolección de datos sea más complejo, afectan al timing del
proyecto e inciden en los costes de la recolección de datos. Se trata de un problema inherente al
muestreo por cuotas, pero que cobra importancia cuando recogemos información online.

Pensemos en las grandes diferencias entre la recolección de datos online y offline. Si hemos
definido una cuota por sexo en una encuesta presencial, una vez hemos alcanzado nuestro
objetivo de varones dejamos de interceptar a hombres en la calle. Y es fácil, ¡porque sabemos
diferenciar entre hombres y mujeres a simple vista!

En cambio, el proceso online es totalmente distinto: enviamos una serie de invitaciones por correo
electrónico a los candidatos y esperamos a que la gente reciba los correos, los abran, accedan
a la encuesta online y completen su participación. Cuando alcanzamos un target de hombres,
no podemos impedir que más candidatos varones accedan a la encuesta porque no podemos
eliminar las invitaciones enviadas por correo electrónico una vez recibidas. Tendremos que
descartar las participaciones que exceden nuestra cuota, ya que carecen de valor para nosotros y,
además, suponen un coste para el panel de acceso online.

Cuanto más complejas sean las cuotas, más costes y tiempo necesitaremos para llevar a cabo la
recolección de datos online. El gráfico siguiente muestra el número aproximado de personas que
tenemos que añadir al tamaño de la muestra debido al exceso de cuota para una muestra con
un tamaño de 1.000 y cuotas uniformes. Según este gráfico, fijar una cuota con un tamaño=2
(dividiendo el tamaño objetivo de 1.000 en dos grupos objetivo de 500 individuos) implica
tener un 2,5 % de encuestados más. Para una cuota con un tamaño=8 (8 grupos objetivo de 125
individuos), la muestra tiene que ser un 13,1 % más grande. Por último, si dividimos el tamaño
objetivo en 100 cuotas, tendremos que doblar el tamaño de la muestra (+96,6 %).

Fundamentos de la recolección de datos online 15


El muestreo por cuotas online efectivo

3. Decide si quieres o no que las cuotas sean convergentes o divergentes.

Hablamos de cuotas divergentes cuando los objetivos de cada cuota se definen de forma
independiente. Por ejemplo, para una muestra con un tamaño de 1.000 encuestados,
necesitaremos 500 (50 %) hombres y 500 (50 %) mujeres, y 500 (50 %) jóvenes y 500 (50 %)
personas mayores. De este modo, asumes el riesgo de que acabes con 500 jóvenes varones y 500
mujeres mayores. Este resultado es perfectamente compatible con tu definición de cuota, ¿pero te
gusta realmente esta distribución?

Para evitar este efecto, utilizaremos cuotas convergentes. Esto significa definir un tamaño objetivo
para cada combinación de variables: 250 (50 % x 50 %) hombres jóvenes, 250 (50 % x 50 %)
mujeres jóvenes, 250 (50 % x 50 %) hombres mayores y 250 (50 % x 50 %) mujeres mayores.

¿Utilizamos cuotas convergentes o divergentes para recolectar datos online? Pues depende de
nuestras prioridades. En teoría, las cuotas divergentes deberían simplificar la recolección de datos.
La definición de una cuota convergente siempre se corresponde a la definición equivalente de
cuota divergente, pero no al revés. Podemos comprobar este hecho fácilmente con el ejemplo
anterior.

En definitiva: las cuotas divergentes son, en principio, más económicas y rápidas, pero no
siempre es así. Siguiendo con el ejemplo anterior, si el panel de acceso online está claramente
distorsionado en favor de los jóvenes y los hombres, es probable que cuando tengamos 500
encuestas, la mayoría de ellas sean de hombres jóvenes. Esto significa que las 500 encuestas
restantes tendrán que proceder de nuestro target de difícil acceso: mujeres mayores. A veces es
mejor tener cuotas convergentes porque nos ofrecen un progreso equilibrado simultáneamente
en todos los targets.

¿Qué podemos hacer para superar este reto? Nuestro consejo es que (1) apuestes por cuotas
divergentes solo si el panel de acceso online presenta una distribución equilibrada entre los
targets (por ejemplo, en lugar de tener una distribución por sexo de 50 %-50 %, tiene un 45 %-55
% pero no 30 %-70 %) y (2) utiliza siempre cuotas convergentes si quieres analizar subtargets en
profundidad (por ejemplo, si quieres analizar las diferencias entre hombres mayores y mujeres
mayores).

Fundamentos de la recolección de datos online 16


Planificar la recolección
de datos online
La velocidad es una ventaja clara de la recolección de datos
online.
Es mucho más rápido enviar miles de invitaciones por correo electrónico y permitir que los
participantes realicen las encuestas de forma simultánea que llamar a la gente desde un call center
o interceptar al público en la calle para hacer encuestas.

Los campos de trabajo online suelen tardar entre 2 y 5 días, en función del tamaño de la muestra,
la población objetivo y, desde luego, el panel de acceso online que utilicemos. En principio, la
recolección de datos online se puede hacer en menos de dos días. Para ello, tendremos que invitar
a más candidatos para que participen en el mismo período de tiempo. Sin embargo, quizás no sea
buena idea para nuestros datos.

¿Quién tiene más probabilidades de participar en encuestas online si hay un período de tiempo
limitado para ello? La respuesta es usuarios asiduos de Internet, adictos a los smartphones o
empleados de oficina. Con frecuencia, la representatividad de las fuentes de participantes es un
tema que preocupa seriamente a los investigadores. Sin embargo, se infravaloran los efectos de un
proceso de recolección de datos inadecuado.

El gráfico siguiente, elaborado con datos de los 6 paneles Netquest más grandes, nos ayuda a
entender los efectos de limitar el tiempo de participación.

Fundamentos de la recolección de datos online 17


Planificar la recolección de datos online

La participación en encuestas online se reduce con el tiempo. El 11 % de las participaciones se


producen en la primera hora y el 22 %, en un plazo de 3 horas. Pero si cerramos nuestro trabajo
de campo a las 3 horas, perderemos el 78 % de las participaciones, por lo que nuestra muestra
resultará más cara. Y lo que es aún peor: no sabremos si los participantes que no han podido
participar son distintos a los que sí han participado, distorsionando así la muestra.

En conclusión, la recolección de datos online es más rápida que la recolección de datos offline,
y puede ser todavía más rápida, pero a expensas del sesgo de la muestra y de incurrir en unos
costes mayores.

Fundamentos de la recolección de datos online 18


Encuestas eficaces para el
trabajo de campo online
Si tienes experiencia en la investigación de mercados
cuantitativa, probablemente ya conozcas los fundamentos del
diseño de cuestionarios.
Los aspectos básicos que hay que tener en mente son los mismos para la recolección de
datos online y offline. El diseño de encuestas es un tema demasiado amplio para verlo aquí
en profundidad, pero a modo de recordatorio, los pasos para hacer un buen trabajo son los
siguientes:

1. Establece el objetivo del cuestionario: ¿Cuál es la finalidad de la investigación?


2. Fija las preguntas que se van a hacer.
3. Elige el tipo de pregunta más adecuado entre las distintas opciones (preguntas abiertas o
cerradas, respuesta única o múltiple, preguntas de clasificación, preguntas de puntuación,
etc.).
4. Especifica los términos más adecuados para cada pregunta según la población objetivo.
5. Crea la secuencia de preguntas y el diseño del cuestionario de forma lógica para el
participante.

Las mejores prácticas para diseñar cuestionarios offline efectivos también son aplicables online:

• Sé conciso, breve y claro. Evita las frases complejas.


• Evita preguntar dos cosas distintas en una misma pregunta.
• Evita las preguntas negativas que puedan confundir a los participantes.
• Pide respuestas precisas.
• Si utilizas preguntas cerradas, asegúrate de dar todas las respuestas posibles (plantéate
incluir la opción «Otros»).
• Evita las preguntas tendenciosas.

Sin embargo, hay una serie de recomendaciones para las encuestas online.

1. Utiliza páginas múltiples en lugar de desplazamientos infinitos.


2. Pregunta una sola cosa cada vez y limita el cuestionario a una pregunta por página. No
permitas que el encuestado navegue por la página y decida en qué orden responde a cada
pregunta.

3. La entrevista debe tener una longitud moderada. La regla de oro son 20 minutos como
máximo y 5 minutos si los encuestados utilizan dispositivos móviles.

Fundamentos de la recolección de datos online 19


Encuestas eficaces para el trabajo de campo online

4. Utiliza encuestas online responsivas que se adapten correctamente a los distintos tamaños
de pantallas (ordenador, tableta, móvil).

5. Emplea un lenguaje específico. Los participantes online leen en diagonal para buscar
palabras y mensajes clave.

6. Incluye imágenes e iconos cuando puedas, ya que mejorarás la experiencia de usuario de


los participantes.

7. Insertar vídeos en una encuesta es una funcionalidad específica de las encuestas online y
que marca la diferencia respecto a las encuestas offline. Aprovéchala (por ejemplo, pruebas
creativas o comerciales), pero ten en cuenta que la participación se verá reducida por varios
factores: la compatibilidad de los vídeos con navegadores no actualizados, ancho de banda
limitado en los teléfonos móviles y, en algunos casos, las personas que no quieren subir el
volumen de los dispositivos (por ejemplo, si están en el transporte público).

8. Cumple los estándares de Internet y olvídate de reinventar la rueda. La gente espera que,
al pulsar un botón de radio, los demás botones de radio cercanos aparezcan como no
seleccionados. Todos los elementos de una página web (casillas de verificación, cuadros de
inserción de texto, botones para enviar, texto subrayado...) deben actuar tal y como la gente
espera.

9. Evita las baterías de preguntas. De hecho, la investigación ha puesto de manifiesto que


las ventajas potenciales de agrupar preguntas en una escala de respuestas compartida
(menor tiempo de respuesta y más correlación entre elementos) no compensa los
inconvenientes (una peor experiencia del participante, una mayor tasa de abandono y
menos diferenciación entre respuestas)(*).

10. Aprovecha las oportunidades que te ofrece la tecnología: simuladores de compra,


cuestionarios online conjuntos, entradas de voz, reconocimiento facial, rastreo ocular, etc.
Actualmente, disponemos de un amplio abanico de opciones nuevas y prometedores para
recolectar datos online.

(*)Melanie Revilla, Carlos Ochoa. Telematics and Informatics, abril 2016. “An experiment comparing
grids and item-by-item formats in web surveys completed through PCs and smartphones”

Fundamentos de la recolección de datos online 20


Datos de calidad
Si estás pensando en utilizar la recolección de datos online
por primera vez, o incluso si la has empleado varias veces,
debes plantearte la pregunta siguiente: ¿Hasta qué punto se
puede comparar la calidad de los datos online y los datos
offline?
Hay argumentos en contra de la calidad de los datos recogidos online, pero, al mismo tiempo,
hay muchos otros en favor. De hecho, existen múltiples formas de controlar la calidad de los
datos recogidos online que nos permiten superar los principales inconvenientes y aprovechar las
virtudes de esta metodología al mismo tiempo.

VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS EN TÉRMINOS DE CALIDAD

Ventajas Inconvenientes

• Ausencia de sesgos del entrevistador: las • Es difícil controlar estrictamente quién participa
respuestas no se ven distorsionadas por las (por ejemplo, en encuestas prfundamentos
diferencias del estilo social y la personalidad observamos visualmente la edad aproximada y el
de los entrevistadores o la forma de presentar sexo de los participantes, pero en Internet no es
determinadas preguntas. posible).
• Mayor fiabilidad ante preguntas sensibles • Mayor riesgo de querer satisfacer debido
(preferencias políticas, estado de salud, a la ausencia del entrevistador y el uso de
religión...) debido al anonimato del encuestado recompensas. La voluntad de satisfacer es una
(**) estrategia a la que recurren los encuestados para
responder a preguntas con el mínimo esfuerzo.
• Ausencia de errores de transcripción. Los
(***)
participantes envían sus preguntas de forma
digital y directa en el cuestionario. • La comparabilidad se puede ver afectada por la
gran diversidad de dispositivos que utilizan los
• Fácil recolección de metadatos para evaluar
participantes: navegadores distintos, versiones
la calidad, permitiéndonos así aplicar medidas
de los navegadores, dispositivos, tamaño de las
de corrección. Casi todos los softwares de
pantallas...
encuestas profesionales recogen datos como el
tiempo de participación, el tiempo por pregunta • Cuando se recompensa la participación, el
o el número de interrupciones del cuestionario. comportamiento del participante se puede ver
afectado. Por ejemplo, un panel que ofrece solo un
tipo de recompensa a cambio de la participación
puede sobrerepresentar una población objetivo
en concreto, o si el panel solo recompensa a los
participantes que forman parte de la población
objetivo (esto es, los que pasan las preguntas de
filtro), la gente se puede ver tentada a mentir.

(**) http://web.comhem.se/u22779327/16/k16docs081211.pdf
(***) http://www.businessdictionary.com/definition/satisficing.html

Fundamentos de la recolección de datos online 21


Datos de calidad

Si nos fijamos en el resumen anterior, es obvio que la recolección de datos online tiene ventajas
e inconvenientes. En este sentido, es parecida a cualquier otra metodología. Sin embargo, la
recolección de datos online tiene una ventaja esencial respecto a otras opciones: la mayoría de
inconvenientes se pueden minimizar (o incluso eliminar) seleccionando una fuente de datos fiable
y aplicando los controles de calidad adecuados en el cuestionario online.

7 estrategias comunes para mejorar la calidad son:

1. Compara los datos de la encuesta con los datos del panel para detectar identidades
fraudulentas. Por ejemplo, cuando se pregunta la edad y el sexo, es fácil validar la respuesta
del panelista si esta persona se ha unido al panel.
2. Pon a prueba la atención que los panelistas prestan a la encuesta comparando las
respuestas dentro de la encuesta para evaluarlas. Puedes hacer la misma pregunta dos
veces (de forma ligeramente distinta) y en un momento distinto en el mismo cuestionario.

3. Aplica una Comprobación de manipulación de las instrucciones (IMC, por sus siglas en
inglés) si la duración de la encuesta es larga (>15 minutos). Las IMCs son preguntas cuyo
objetivo es verificar que el participante haya prestado atención al cuestionario, del tipo «Si
estás leyendo esta pregunta, selecciona la tercera opción».

4. Recompensa a las personas por participar y no a cambio de corresponderse con los


requisitos de la población objetivo que quieres encuestar. Si solo pagamos a los que
responden «sí» a la pregunta de filtro (por ejemplo, «¿Utilizas este producto?» «¿Conoces
esta marca?») estaremos incitando a la gente a mentir en la próxima encuesta que les
enviemos.

5. Fija un tiempo mínimo necesario para realizar la encuesta y descarta a los participantes que
acaben antes. Se trata de una forma fácil de detectar a participantes que responden sin
prestar atención.

6. Comprueba las respuestas a preguntas abiertas para identificar respuestas inválidas (como
«---», «aaaaa») y elimina la participación integral de estos participantes, no solo la respuesta.
Si alguien responde así a una pregunta abierta, es probable que esta persona haya
respondido inadecuadamente a toda la encuesta.

7. Recoge tantos metadatos (datos relacionados con cómo y cuándo se recoge la información)
como puedas; te ayudará a identificar problemas. En las encuestas online es muy sencillo.
Por ejemplo, algunos encuestados pueden haber tenido problemas para ver una pregunta
en un navegador concreto. Si recopilamos estos metadatos tendrás más probabilidades de
entender el problema.

Si te estás planteando utilizar un panel de acceso online, merece la pena entender la información
siguiente para asegurarte de que eliges al adecuado para tu proyecto:

1. ¿Cómo se captan los nuevos miembros del panel? ¿Es un panel abierto o cerrado? ¿Dónde
se capta? ¿Recompensan el registro de los panelistas para eliminar la autoselección?

Fundamentos de la recolección de datos online 22


Datos de calidad

2. ¿Cómo recompensa el panel la participación? ¿Recompensan todas las participaciones o


solo las que acaban en una encuesta válida? Los paneles que solo pagan las encuestas
válidas tienen más probabilidades de recibir respuestas fraudulentas cuando se investigan
poblaciones objetivo de difícil acceso.

3. ¿Cuántas encuestas realizan los panelistas al mes? Algunos paneles envían entre una y dos
encuestas al día a los panelistas y los profesionalizan.

4. ¿Cuál es el tamaño real basándonos en el número máximo de resultados del panel? Este
número es fundamental porque nos da mucha información del panel. Salvo que el panel
se encuentre en fase de creación, cuando una empresa de paneles genera un volumen
importante de actividad con un panel pequeño probablemente estaremos ante una
empresa de river sampling y no un panel de verdad. Para asegurarte, pregunta cuál es el
número máximo de resultados, esto es, el tamaño máximo de la muestra que nos puede
ofrecer el panel en una encuesta de una toma. Esta respuesta nos aporta una información
más valiosa que preguntar por el tamaño del panel porque muchas empresas cuentan
como panelistas a personas que se han registrado hace mucho tiempo pero que no
participan activamente.

5. ¿El panel cuenta con una certificación con una norma de calidad como ISO26362? Las
normas ISO nos dan la seguridad de que el panel ha sido auditado y que quiere compartir
la información anterior con transparencia.

Fundamentos de la recolección de datos online 23


Privacidad
La privacidad se está convirtiendo en una de las principales
preocupaciones de los usuarios de Internet.
La investigación de mercados online se ve directamente afectada por este fenómeno porque, al
fin y al cabo, los investigadores recopilan información de las personas, y los participantes pueden
considerar algunos de los datos recopilados como altamente sensibles.

Como investigadores, esta es una cuestión importante. Los investigadores están obligados a
trabajar conforme al código de conducta del sector (las pautas ESOMAR) y deben cumplir todas
las obligaciones legales aplicables en el lugar donde recopilamos la información.

Deberíamos seguir la recomendación anterior por dos razones, fundamentalmente:

• Es nuestro deber como profesionales de la investigación de mercados. Tenemos que tender


una relación de confianza con la población si queremos preservar nuestra profesión.
• Nuestros datos se pueden ver seriamente perjudicados si no damos seguridad a los
participantes, ya que solo participarán aquellos que no se preocupen por las cuestiones de
privacidad o, aún peor, nos darán información falsa.
Si vas a recolectar datos online, no olvides las recomendaciones siguientes:

1. Ofrece acceso a la política de privacidad, un documento en el que informamos de nuestra


política a la hora de recolectar y difundir información de los participantes. Si utilizas un
panel de acceso online, esto es responsabilidad del panel.
2. Comunícate de forma transparente con los panelistas durante toda su actividad: si recopilas
información especialmente sensible, con la política de privacidad no es suficiente. Incluye
mensajes claros en lugares clave de la encuesta.
3. Los casos siguientes son casos especiales que requieren un tratamiento distinto: incluir/
recolectar cookies de terceros, recolectar información de navegación, pedir datos de
geolocalización, pedir las direcciones de correo postal o electrónico y números de teléfono.
4. Cumple las obligaciones legales del país en el que recopilas la información, no solo en tu
país de origen. Las obligaciones legales pueden variar enormemente entre países.
5. Ten en cuenta las diferencias entre países a nivel de privacidad. Por ejemplo, en Estados
Unidos y Europa es habitual preguntar por los ingresos del hogar, la entidad bancaria
y el número de hijos, pero en América Latina, estas preguntas se pueden considerar
inadecuadas por el riesgo de secuestro.

Por último, para ayudarte a evaluar hasta qué punto la gente está dispuesta a participar en
proyectos de recolección de datos no convencionales (algunos de ellos estrechamente vinculados
a la privacidad), los resultados de una encuesta experimental realizada en el panel de Netquest dio
los resultados siguientes:

Fundamentos de la recolección de datos online 24


Privacidad

ACTIVIDAD DISTINTA A ENCUESTAS VOLUNTAD DE PARTICIPAR

Probar un producto en casa 72,4 %

Enviar fotos haciendo actividades concretas 54,9 %

Escanear códigos de barras de productos 51,8 %

Enviar la posición GPS 20,0 %

Grabar el rostro para medir las emociones viendo un vídeo 17,4 %

Instalar un medidor para hacer un seguimiento de la 17,0 %


información de navegación en el smartphone

Instalar un medidor para hacer un seguimiento de la


15,8 %
información de navegación en el ordenador

Fundamentos de la recolección de datos online 25


Reporting y visualización
El reporting no forma parte del proceso de recolección de
datos, así como tampoco la visualización (comunicación visual
de los datos). Ambas actividades conforman el punto de
partida del análisis de los resultados.
Sin embargo, la investigación online ha cambiado ligeramente el panorama: los datos se recogen
en tiempo real y los clientes quieren ver los resultados también en tiempo real. Esto implica que
las empresas de investigación de mercados ofrezcan dashboards online, herramientas de reporting
«hazlo tú mismo» e infográficos predefinidos que se llenan de datos tan pronto como se reciben.

Por descontado, estas soluciones extremadamente rápidas restringen el toque humano; el gran
valor que aporta un analista experto que profundiza en los datos para encontrar resultados
sorprendentes no es compatible con los resultados en tiempo real. Pero la velocidad es el mantra
de las empresas modernas y, como investigadores, no deberíamos ir a contracorriente.

Esto no significa que los análisis de resultados individualizados y exhaustivos carezcan de valor,
sino que debemos saber elegir entre ambos planteamientos en función del cliente y el problema
que se investiga, o combinarlos cuando fuere necesario. Por ejemplo, los clientes online (esto es,
de las páginas web de comercio online) están muy acostumbrados a trabajar con datos, de modo
que se sienten cómodos con un dashboard online, mientras que es probable que los clientes más
tradicionales no quieran prescindir de las recomendaciones personalizadas.

La mayoría de soluciones de software que se utilizan para recolectar datos online incluyen alguna
función de reporting online. Más allá de estos informes básicos, hay soluciones especializadas que
permiten implementar el reporting y la visualización avanzados. A modo de ejemplo, se enumeran
algunas de ellas a continuación:

• Dapresy (www.dapresy.com) ofrece herramientas de visualización de datos y herramientas


de inteligencia empresarial que permiten a los investigadores procesar, analizar y crear
dashboards basados en infográficos.

• Tableau (www.tableau.com) ayuda a los investigadores a ver y entender los datos. Permite
conectar con casi todas las bases de datos, ofrece la función de arrastrar y soltar para crear
visualizaciones y compartir con un solo clic.

• Qlik (www.qlik.com) ofrece plataformas intuitivas para la visualización de datos a medida,


aplicaciones de análisis guiados, análisis integrados y reporting.

Fundamentos de la recolección de datos online 26


Reporting y visualización

• Microsoft BI (powerbi.microsoft.com) es un conjunto de herramientas de análisis


empresarial para analizar datos y compartir información. MBI permite hacer un seguimiento
de nuestra actividad y recibir respuestas rápidamente con unos dashboards muy completos
disponibles en todos los dispositivos.

• IBM Cognos (www-03.ibm.com/software/products/en/cognos-analytics) es una plataforma


BI para empresas para la detección de datos ordenada y el reporting gestionado que
automatiza la creación de informes y dashboards de modo que los usuarios puedan
hacerlo por sí mismos.

• Microstrategy (www.microstrategy.com) ofrece funciones de reporting para empresas y


detección de datos para la productividad móvil y la telemetría en tiempo real, y pone a
disposición de las empresas un amplio abanico de posibilidades para transformar sus datos
en inteligencia del mundo real.

Fundamentos de la recolección de datos online 27


Contacto
EE.UU. & Canadá Colombia
americas@netquest.com colombia@netquest.com

Portugal Brasil
portugal@netquest.com atendimento@netquest.com

España Cono Sur


iberia@netquest.com cs.sales@netquest.com

Europa & Asia México


rfqinternational@netquest.com latamnorte@netquest.com

netquest.com

También podría gustarte