Está en la página 1de 22

Medicin y Tabulacion de los Datos

En mercadotecnia la medicin relacionada a la Investigacin de Mercados puede definirse como la asignacin de nmeros a los objetos o fenmenos atendiendo a reglas establecidas de antemano.
Tanto las mediciones como los instrumentos que nos permiten realizarlas son imprescindibles en la Investigacin de Mercados; el modo de seleccionarlos repercute a menudo en la exactitud con que se hacen las mediciones.

Variables que intervienen en la Medicin de los Datos


Regularmente la meta de un trabajo de medicin ser determinar una o ms variables de las siguientes clases dentro de una investigacin: 1. Variables del estado mental. Son variables internas del individuo a quien se est estudiando. A esta categora pertenecen variables como: las actitudes, caractersticas de personalidad, grados de conocimiento del producto y preferencias de los mismos.

2. Variables de estado. Son variables externas al individuo, fciles de medir y cuantificar como: edad, ingresos, propiedad de un bien, gnero, escolaridad, etc.

3. Variables conductuales. Se refieren a la accin( pasada, presente o futura ) ms que a un estado contemporneo, un ejemplo en esta categora son las intenciones ya que ellas representan relaciones futuras de cursos de accin probables del consumidor. Desde luego algo que interesa es la adquisicin de nuestro producto.

En la medida que se identifique y precise las relaciones existentes entre los tipos de variables, los esfuerzos dedicados a la investigacin de mercados rendirn mejores frutos. Ejemplo: si se lograra averiguar que las personas con ciertos ingresos y escolaridad( estado ) tienen una actitud positiva hacia cierta actividad( estado mental ) con esa informacin se disear mejor un nuevo plan promocional para aumentar la posibilidad que se vuelvan clientes( comportamiento futuro )

Relacin de Variables en la Medicin de los Datos

Para analizar la relacin que hay entre 1) la frecuencia de asistencia y 2) la pertenencia a una asociacin civil o grupo estudiantil se puede plantear las siguientes preguntas:
1. Con que frecuencia asiste a un bar X? __ Menos de una vez __ una o dos veces ___ Tres o mas veces por semana por semana por semana La pertencia a algn tipo de asociacin? ___ Si ___ No

2.

Anlisis del Cruce de Variables de Medicin

Frecuencia de Asistencia Pertenencia a un grupo o sociedad estudiantil Menos de 1 vez Si No Total 10 20 30 Una o dos veces 45 65 110 Tres o ms veces 50 30 80 Total

105 115 220

Sntesis de las escalas de Medicin


Medidas tpicas para
Escala
Nominal( Identificacin o categorizacin ) Ejemplo de Mercadotecnia
Posee o no posee un X vehculo Varn o mujer Tenedor o no tenedor de un boleto del teatro Prefiere una cerveza Pilsener a una cerveza Tecate En comparacin con la marca X el pan Enriquecido sabe mejor Tiene una actitud ms positiva ante el candidato A que ante el candidato B Selecciona la alternativa discrepa ligeramente en una pregunta de instrumento con intervalos de igual aparicin para medir actitudes. La actitud ante la medicin socializada en +1.5 cm. en determinado instrumento de la escala de Likert. Edad Ingresos Kilos de detergente comprado cada ao

Descripcin Frecuencia Porcentaje Moda Tabulacin Cruzada Mediana Moda Percentil Media

Anlisis Prueba de Ji cuadrada

Ordinal(mayor o menor que)

Correlacin de rango-orden Prueba del signo Escala multidimensionales no mtricas


Anlisis de Correlacin Anlisis discriminatorio

De intervalo (mayor que o menor que, unidad constante de medicin, pero un punto cero de intervalo)

Desviacin Estndar

Anlisis de Varianza Escalas multidimensionales mtricas

Razn(todas las anteriores mas un punto de cero absoluto

Lo mismo que en la escala de intervalo

La Tabulacin en el Anlisis de los Datos


Al recuento y la sintensis de las respuesta se le conoce como la tabulacin y consiste en el conteo de cuantas respuestas se tiene por categora; esta puede adoptar dos formas bsicas: i) la tabulacin sencilla y ii) la tabulacin cruzada. El recuento y la sntesis de las respuestas puede hacerse de forma manual o por medio de un procesador, segn sea el volumen de los datos y la disponibilidad de programas adecuados. La Tabulacin Sencilla, denominada tambin tabulacin marginal o con un solo criterio, es la que culmina con una distribucin de frecuencias. La Tabulacin Cruzada o cruce de variables, muchas veces los resultados ms tiles de las investigaciones de mercado representan importantes relaciones entre variables, y en este caso se requiere de hacer una tabulacin cruzada, que consiste en revisar la valoracin que puede existir entre varias variables de estudio. La Tabulacin cruzada, es una de las tcnicas ms comunes con que se sintetizan los datos de la investigacin de mercados, ya que permite identificar estadsticamente las relaciones significativas entre las variables y ofrece la ventaja adicional de presentar un panorama lgico de los datos que el laico puede examinar e identificar visualmente

La Tabulacin en el Anlisis de los Datos


Un ejemplo de la tabulacin cruzada de dos criterios es el caso de las Tabletas Dietticas Dr. Helium, el cual incluye dos de las tres mediciones que se presentan a continuacin:
Edad Nmero de Respondientes No. de Meses Ingiriendo Tabletas Dietticas Nmero de Respondientes Libras perdidas desde que comenzaron a usar las tabletas Nmero de Respondientes

Menos de 21 21 30 31 40 41 50 51 60 Ms de 60

47 104 132 118 61 38

Menos de 2 2 3 4 5 Ms de 5

90 80 80 60 50 140

Sin Prdidas 15 6 10 11 15 16 20 Ms de 20

113 104 130 88 47 18

Total

500

Total

500

Total

500

Una sencilla tabulacin de las respuestas de una encuesta hipottica de 500 consumidores de las tabletas dietticas del Dr. Helium. El resultado es slo una distribucin de frecuencia del nmero de respuestas en cada categora de las tres variables.

La Tabulacin en el Anlisis de los Datos


La tabulacin cruzada del ejemplo anterior cruza 1) el nmero de meses que el respondiente lleva ingiriendo la tableta y 2) el nmero de libras que el respondiente ha perdido desde que us por primera vez el producto. Visualmente se puede decir que existe alguna relacin entre la prdida de peso y la ingestin de las tabletas, sin embargo se debe afirmar esto luego del anlisis y otra clase de datos. La tabulacin cruzada con dos criterios se parece a un experimento factorial de dos variables de 6 x 6. En efecto la tabla refleja los resultados de un experimento diseado especficamente para determinar si las dos variables guardan una relacin entre s. Como sucede con el experimento factorial, ms de dos variables tambin pueden estar presentes, si bien describirlas en una hoja bidimensional. La tabulacin cruzada es una de las tcnicas ms comunes con que se sintetizan los datos de una investigacin de mercados.

La Tabulacin Cruzada en el Anlisis de los Datos


Nmero de meses usando las tabletas dietticas
Debajo
2 Sin Prdida 17 24 19 18 8 4 2 10 17 30 15 5 3 3 15 10 28 21 5 1 4 18 14 13 7 6 2 5 14 11 9 5 9 2

Arriba
5 39 28 31 22 14 6 Total

113 104 130 88 47 18 500

No. de Libras perdidas desde que se comenz a ingerir las tabletas

1-5 6 - 10 11 - 15 16 - 20 Ms de 20

Total

90

80

80

60

50

140

La Tabulacin en el Anlisis de los Datos


La tabulacin cruzada permite al analista identificar estadsticamente las relaciones significativas entre las variables y ofrece la ventaja adicional de presentar un panorama lgico de los datos que el laico puede examinar e identificar visualmente. La forma ms eficaz de la tabulacin cruzada es la variedad bidimensional, surgen pocos problemas cuando se estn midiendo ms de dos variables en un estudio. Lo nico que se debe hacer es presentar las dos variables a la vez. As si hay n variables, esto exigira (n(n-1))/2 presentaciones diferentes( la combinacin de n cosas tomadas dos a la vez). En caso de existir 4 variables distintas, habra entonces (4(4-1))/2, o sea 6 presentaciones diferentes bidimensionales. Sin duda limitar el anlisis a dos variables a la vez no es muy aconsejable. Sin embargo , esta variedad sigue siendo uno de los medios mas potentes de demostrar las relaciones de mercadotecnia no versado en mtodos cuantitativos. Despus de todo no quisiramos que el Dr. Helium siquiera es la ignorancia respecto a la eficacia de su producto.

Tabulacin Cruzada de Tres variables


Edad de 40 o menos ingiriendo las tabletas dietticas Bajo
Arriba

Edad de 41 ms nmero de meses ingiriendo tabletas dietticas Bajo


Arriba

2
Sin Prdida
No. De Lbs. Perdidas desde que se comenz a usar

2
7

3
8

4
10

5
8

5
20

Total
65

2
5

2
3

3
7

4
8

5
6

5
19

Total
48

12

1-5
6-10 11-15 16-20 Ms de 20

14
10 11 3 3

10
18 10 3 1

5
13 13 2 0

11
7 4 2 2

6
6 3 5 1

16
16 10 8 5

62
70 51 23 12

10
9 7 5 1

7
12 5 2 2

5
15 8 3 1

3
6 3 4 0

5
3 2 4 1

12
15 12 6 1

42
60 37 24 6

Total

53

49

41

36

29

75

283

37

31

39

24

21

65

217

Ejemplo de tabulacin cruzada de tres variables a) edad del respondiente, b) nmero de meses de ingerir las tabletas dietticas y c) nmero de libras perdidas desde que se comenzaron a utilizar.

La Sntesis estadsticas de los datos


Adems de resumir los datos en forma tabular, como en las tabulaciones con un criterio, con dos criterios o con tres criterios descritos, estos se pueden presentar en trminos estadsticos. Las formas principales en que los datos estadsticos se sintetizan estadsticamente son por medio de las medidas de centralidad y las medidas de dispersin. As mismo, otro importante descriptor estadstico es el porcentaje. MEDIDAS DE CENTRALIDAD. Las tres formas ms comunes de describir la centralidad de un conjunto de datos son: la moda, la mediana y la media. MEDIDAS DE DISPERSION. Adems de medir la centralidad de un conjunto de datos, tambin puede convenir determinar la cantidad de dispersin que existe entre un grupo de mediciones. Hay tres principales descriptores de dispersin que son: el intervalo( rango ), la desviacin estndar y la varianza.

La Sntesis estadsticas de los datos


MEDIDAS DE CENTRALIDAD. Las tres formas ms comunes de describir la centralidad de un conjunto de datos son: la moda, la mediana y la media.
Supngase que un fabricante de una rasuradora desechable ha realizado un estudio para saber Cuntas rasuradas pueden hacerse con l? Obteniendo los siguientes resultados:
Nmero de Personas 1 2 3 4 5 6 7 8 9 10 11 Nmero de Rasuradas 11 9 6 14 12 8 14 10 7 14 9

La Sntesis estadsticas de los datos


LA MODA. Es el valor que ocurre con ms frecuencia. Llamase la ms tpica de las respuestas. En el ejemplo de la rasuradora desechable se puede identificar la siguiente distribucin de frecuencias a fin de identificar el valor de la moda.
Nmero de Rasuradas 6 7 8 9 10 11 12 13 14 Nmero de Personas que Obtuvieron esas Rasuradas 1 1 1 2 1 1 1 0 3

En estos datos la moda es 14 rasuradas, ya que este resultado se obtuvo en mayor nmero de individuos que cualquier otro.

La Sntesis estadsticas de los datos


Atendiendo a la informacin, el fabricante puede hacer que en la publicidad del producto se afirme que la rasuradora desechable en prueba de consumidores brind a los usuarios un promedio de 14 rasuradas.
La debilidad potencial de la moda es la posibilidad de que la medicin anotada con mayor frecuencia tal vez no sea muy representativa del total del conjunto de los datos. Por ejemplo en los datos 8 de 11 personas tienen menos de 14 rasuradas y sin embargo la moda estadstica es 14. Como usuario de la Investigacin de Mercados conviene ser un poco escptico respecto a la moda, sobre todo si las otras medidas de centralidad son muy diferentes o no se proporcionan.

La Sntesis estadsticas de los datos


LA MEDIANA. Es el valor de los datos que tiene la misma cantidad de respuestas por encima que por debajo. Si las respuestas se enumeran por orden de rangos desde la ms grande hasta la ltima, la mediana ser la que se halle en la mitad. En el ejemplo de la rasuradora desechable se puede identificar el siguiente orden de distribucin a fin de identificar el valor de la media.
14 14 14 12 11 10 9 9 8 7 6

Se puede observar que el Valor de 10 es el nmero promedio de rasuradas obtenidas para una muestra de 11 personas. Cinco lograron ms de 10, en tanto que otros 5 lograron menos de 10. Si el caso es que haya un nmero par de respuestas( es decir no se tiene una respuesta que est a la mitad ) se necesita slo tomar el promedio de dos respuestas que juntas se encuentren en la mitad. Ejemplo, la mediana de 6, 4, 2, 0 ser 3, ya que 4 y 2 representan la posicin intermedia. La mediana suele ser ms representativa que la moda. Adems por basarse en un rango ordinal de los datos, est menos expuesta a puntuaciones extremas

La Sntesis estadsticas de los datos


LA MEDIANA. Es la medida de mayor uso de la centralidad de un conjunto de datos; los legos la conocen con el nombre de promedio. Aunque se utiliza dentro de un contexto del lenguaje comn, designa en estadstica a la suma de los datos divididos entre el nmero de los puntos de los datos. En el ejemplo de la rasuradora desechable, la media o nmero promedio, de las rasuradas obtenidas ser la suma de las respuestas dividida entre 11. 11 + 9 + 6 + 14 + 12 + 8 + 14 + 10 + 7 + 14 + 9 Media muestral = X = -----------------------------------------------------------11 X = 10.36 rasuradas La media de los datos puede calcularse como 10,36 rasuradas por persona. Una caracterstica importante de la media, es que se puede calcular sin necesidad de disponer los datos en una distribucin de frecuencia ni clasificar por orden las calificaciones. Otro atributo consiste en que se presta a hacer generalizaciones estadsticas de la muestra a la poblacin.

La Sntesis estadsticas de los datos


Un ejemplo de que se presta a hacer generalizaciones estadsticas de la muestra a la poblacin, es cuando una muestra probabilstica se ha extrado y la media muestral se emplea para estimar y construir un intervalo de confianza para la media de la poblacin. La principal debilidad de este estadstico como descriptor de un conjunto de datos es su susceptibilidad a mostrar valores extremos. Por ejemplo, si la muestra de participantes incluye a una persona mal informada que cometi el error de usar el extremo equivocado de la rasuradora, de modo que obtuvo 935 rasuradas antes de acabar con el mango de plstico. Ello eleva la media muestral a aproximadamente 95 rasuradas, evidentemente un indicio falso de la verdadera durabilidad de la rasuradora. Si es cierto que estos casos rara vez ocurren en la investigacin, otros casos extremos si ocurren. Por ejemplo, cuando se miden los ingresos de los consumidores, no pocas veces el ingreso medio es superior a la mediana, lo que refleja los ingresos de unos cuantos individuos con excelentes percepciones.

La Sntesis estadsticas de los datos


Al calcular cualquiera de las anteriores medidas, se recomienda cerciorarse que los datos estn en una escala apropiada. Como en las escalas de medicin, estos descriptores van del ms dbil al ms fuerte (de la moda a la media). Las escalas correspondientes de medicin son: Moda: escala nominal de datos o ms fuerte Mediana: escala ordinal de datos o ms fuerte Media: escala de intervalos o ms fuerte

La notacin o ms fuerte, se debe a que este resumen de datos puede transformarse en la escala ms dbil y no se expresan por un descriptor adecuado para ella. Aunque los datos del estudio de las rasuradoras representa informacin en la escala de razn, estamos en condiciones de determinar la moda( datos tratados sencillamente como un conjunto de categoras ), la mediana( los datos se tratan como un orden por rangos del rendimiento de la rasuradora desechable ) y la media( los datos se tratan en su forma ms fuerte posible, la escala de razn ).

La Sntesis estadsticas de los datos


MEDIDAS DE DISPERSION. Adems de medir la centralidad de un conjunto de datos, tambin puede convenir determinar la cantidad de dispersin que existe entre un grupo de mediciones. Hay tres principales descriptores de dispersin que son: el intervalo( rango ), la desviacin estndar y la varianza. El rango es la ms elemental de las tres medidas: consiste simplemente en la distancia entre los dos valores extremos. Ejemplo, en el estudio de la rasuradoras desechables, un individuo logr apenas 6 rasuradas con la rasuradora desechable, en cambio, otro pudo rasurarse 14 veces antes de que la hoja se volviera inservible. As el intervalo era 14 6, o sea una diferencia de 8 rasuradas. Como el intervalo pone en relieve los valores extremos, no influye en l lo que se pueda calificar como dispersin tpica de los datos.

La Sntesis estadsticas de los datos


El intervalo es una medida til, aunque aproximada, de la cantidad de dispersin en los datos. Un aspecto importante es su gran uso en la descripcin de los resultados de la investigacin que se emplean en algunos anuncios. La Desviacin Estndar y la Varianza, son medidas mas vigorosas de dispersin, pero fciles de calcular. Si la muestra es del tipo probabilstico, la desviacin estndar tambin puede utilizarse para hacer generalizaciones estadsticas a partir de la muestra y aplicarlas a la poblacin de donde se extrae. Ver caso de la rasuradoras desechables.

Otro procedimiento comn es los porcentajes, los cuales representan la proporcin de los elementos de la muestra que caen dentro de varias categoras. Los porcentajes permiten describir las frecuencias en sentido relativo, no absoluto, por ello es ms fcil comparar los grupos y las distribuciones cuando los tamaos de las muestras no son iguales.