P. 1
Analisis e Interpretacion de Resultados

Analisis e Interpretacion de Resultados

|Views: 121|Likes:
Publicado porlletsumen

More info:

Published by: lletsumen on Dec 16, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/16/2012

pdf

text

original

Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados

Conceptos Básicos
• Elemento: Es la unidad acerca de la cual se solicita información. En una investigación con encuestas, por lo regular el elemento es el entrevistado.

AM04003-Análisis e interpretación de resultados
Sesión1. La importancia del muestreo

•Población meta: Es el conjunto de todos los elementos definidos antes de la selección de la muestra y que posee la información que busca el investigador. Una población definida adecuadamente debe definirse en términos de ELEMENTOS, UNIDADES DE MUESTREO, ALCANCE y TIEMPO. Ejemplos:

1

2

Conceptos Básicos
Si deseamos monitorear las ventas de un nuevo producto, como un jabón de tocador, la población podría ser: ELEMENTO: Jabón de tocador UNIDADES DE MUESTREO: Supermercados, farmacias, almacenes de descuentos, tiendas de abarrotes. ALCANCE: Monterrey TIEMPO: 6 al 20 de enero de 2007

Conceptos Básicos
La población para medir la reacción de un comprador hacia un nuevo producto químico industrial sería: ELEMENTO: Ingenieros Químicos UNIDADES DE MUESTREO: Empresas que compran mas de 2 millones de pesos en químicos por año. ALCANCE: La zona norte de la República Mexicana TIEMPO: 2007

3

4

Unidad de muestreo
Es el elemento o elementos disponibles para su selección en alguna etapa del proceso de muestreo. En el tipo de muestreo más simple, que sería el de una sola etapa, las unidades y los elementos de muestreo son los mismos. En el caso de procedimientos más complejos, se pueden tener el número de etapas que el investigador desee, lo que se tiene que hacer es especificar la unidad de muestreo en cada una de las etapas.

Conceptos Básicos
Por ejemplo, una muestra en tres etapas podrías ser: Etapa 1: Ciudades con población de mas de 800,000 habitantes. Etapa 2: Colonias de nivel socioeconómico C+ Etapa 3: Mujeres de 40 años y más

5

6

D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

1

Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados

Marco muestral o de referencia
Representación de los elementos de la población meta que consiste en una lista o grupo de indicaciones para identificar a la población meta. Un ejemplo de esto podrían ser una lista de clase, una lista de votantes registrados, una lista de empleados, directorio telefónico y hasta un mapa. En el caso del mapa se estarían muestreando partes geográficas, como por ejemplo, colonias, cuadras o manzanas dentro de una ciudad.

¿Por qué una muestra?
La alternativa al muestreo es realizar un censo, en el cual se estarían utilizando todos los elementos disponibles de una población definida, como el censo poblacional que realiza el gobierno, por parte de INEGI. Los censos casi no se utilizan en la investigación de mercados, debido a que las poblaciones de interés por lo común incluyen miles o millones de individuos; aunque hay casos en el que un censo puede ser útil para una empresa de productos industriales que sólo tiene un pequeño número de clientes de un producto altamente especializado.

7

8

Beneficios del muestreo

1. Ahorra dinero: claramente ahorraríamos dinero entrevistando a 1000 personas en vez de un millón de personas que compondrían un población dada, en caso de hacer un censo. 2. Ahorra tiempo: definitivamente no sería lo mismo entrevistar a un millón de personas que sólo a 1000, en el caso de una muestra.

3. Puede ser mas preciso: a pesar de lo que pueda parecer, cuanto más pequeño sea un estudio, mayores serán las posibilidades de controlar al personal en cada una de las etapas del proceso de muestreo. Entre más personal se utilice, y más tiempo se lleve el estudio, habrá más errores y resultados menos exactos.

9

10

Bibliografía
• Malhotra, Naresh. Investigación de Mercados, un enfoque práctico. México: Editorial Pearson Educación 2004, (ISBN 970-26-0491-5). • Mc Daniel, Carl. Investigación de Mercados. México: Editorial Thomson 2005, (ISBN 970-686-366-4). • Kinnear, Thomas. Investigación de Mercados, un enfoque aplicado. México: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Créditos:

Lic. Ana María López Navarro

11

12

D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

2

Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados

Proceso de Muestreo

1

Definir la población Identificar el marco muestral Seleccionar un método de muestreo Determinar el tamaño de la muestra Ejecutar el plan

AM04003-Análisis e interpretación de resultados
Sesión 2. Procedimiento de muestreo

2

3

4

5

1

2

1. Definir la población
La población se debe definir en términos de: • Elementos • Unidades de muestreo • Alcance • Tiempo

1. Definir la población
Los datos demográficos tales como edad, ingreso, nivel de estudios, etc., se utilizan mucho para definir a la población. También los estilos de vida se pueden considerar, o bien condiciones de vida como tener poco tiempo disponible para dormir, comer, etc. Por ejemplo, si queremos hacer una investigación para pastillas de cafeína, debemos asumir que una de las características de la población meta debe ser que tenga poco tiempo para dormir, como pueden ser choferes, doctores, enfermeras, etc.
3 4

2. Identificar el marco muestral
Ya que se ha definido la población, el investigador debe buscar un listado que le sirva como marco muestral. Existen algunas fuentes tanto privadas como públicas que pueden servir, pero hay que considerar que todas tienen un grado de error muestral, hay que evaluar bien las fuentes y buscar la que mejor represente a la población meta.

2. Identificar el marco muestral
Para evaluar el error muestral en una “lista”, y ver si le puede servir al investigador, hay que considerar dos puntos: • Evaluar el grado de afinidad de las características del marco muestral con los de la población meta. • Estimar la cantidad de personas no listadas de la población meta.

5

6

D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

1

instrucciones si la casa está vacía. 7 8 3. es muy importante tener un manual detallado para los entrevistadores. etc. 11 5.R. en un club deportivo. si no se encuentran. Por ejemplo. 12 D. para poder descartar a las personas que no califican. Los factores cualitativos que se deben considerar son: • Importancia de la decisión • Naturaleza de la investigación • Número de variables • Naturaleza del análisis • Tamaños de muestra utilizados en estudios similares • Tasas de incidencia • Tasas de cumplimiento • Restricciones de recursos $ 10 No Probabilísticos Probabilísticos Por juicio Por cuotas Aleatorio simple Sistemático Estratificado Bola de nieve Por conveniencia De grupo o agrupamientos 9 4. más sus hábitos de consumo no difieren en la opinión de los registrados. ya que debe eliminarse la participación de ellos al máximo. Del Paseo Residencial Monterrey. si el investigador determina que la cantidad de miembros no considerada dentro de la lista no representa un error considerable para la muestra final. puede ser que se tomen en cuenta solamente los registrados en Internet.. Determinar el tamaño de la muestra Número de elementos que se incluirán en la muestra. si hay terrenos baldíos. Esto se puede hacer en una encuesta con preguntas de filtro. Identificar el marco muestral Para evaluar el grado de afinidad de los miembros de la lista con los de la población meta se utiliza un “rango de incidencia” que son los que calificarían para la muestra. 2. el salto de casas. y debe especificarse detalladamente la ruta a seguir. la puede juzgar como aceptable. en el caso de una encuesta casa por casa. Identificar el marco muestral Para el segundo punto. N.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados 2. en estudios concluyentes las muestras deben ser más grandes. por lo cual podría ser válido el marco muestral. pero hay unos cuantos que no están registrados. 2006. 2 . Por ejemplo. Determinar el tamaño de la muestra En estudios concluyentes se deben tomar en cuenta factores como: • Desviación estándar de la media • Nivel de confiabilidad • Error estándar En estudios de naturaleza exploratorio las muestras tienden a ser más pequeñas. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.L. Seleccionar un método de muestreo Métodos de Muestreo 4. Ejecutar el plan En esta etapa de deben desarrollar procedimientos operacionales para la selección de la muestra.

y muchas veces la ejecución es la que puede constituir un obstáculo para toda la investigación. N. Ana María López Navarro 15 D. (ISBN 970-686-366-4). 13 14 Créditos: Lic. Ejecutar el plan En una muestra probabilística es de suma importancia cuidar los procedimientos. Investigación de Mercados.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados 5.. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.L. 2006. Carl. Thomas. México: Editorial Pearson Educación 2004. • Kinnear. 3 . México: Editorial Thomson 2005. un enfoque práctico. (ISBN 970-26-0491-5). México: Editorial Mc Graw Hill 1996.R. ya que son factores críticos de éxito. Investigación de Mercados. (ISBN 958-600-124-5). Bibliografía • Malhotra. Del Paseo Residencial Monterrey. • Mc Daniel. Investigación de Mercados. un enfoque aplicado. Naresh.

• Entrevistar a las personas que pasen por cierta calle. • Utilizar grupos de estudiantes de cierta universidad. Ejemplos: • Realizar entrevistas en un centro comercial. Muestreo de juicio Se aplica a cualquier muestra en la que los criterios de selección se basan en el criterio del investigador acerca de lo que constituye una muestra representativa. 3 4 Muestreo por cuotas Se seleccionan de manera que las características demográficas de interés para el investigador estén representadas en la muestra en las proporciones meta. N.. 1 . Es muy utilizado por las empresas debido a su bajo costo y facilidad de ejecución. Es decir. Por ejemplo. Muestreo no probabilístico • De juicio • Por cuotas • Bola de nieve 1 2 Muestreo de conveniencia Las muestras por conveniencia se seleccionan. las cuotas aseguran que la composición de la muestra se la misma que la de la población en relación a las características de interés. Del Paseo Residencial Monterrey.R. Muestreo por cuotas Ejemplo: Característica de control Sexo Masculino Femenino Composición de la población Porcentaje 45% 65% Composición de la muestra Porcentaje 45% 65% Número 450 650 5 6 D.L. de acuerdo a la conveniencia del investigador.Universidad Tec Milenio: Profesional AM04003 – Análisis en interpretación de resultados Muestreo no probabilístico • De conveniencia AM04003-Análisis e interpretación de resultados Sesión 3. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. 2006. en una prueba de comercialización se hace un juicio con respecto a qué ciudades podrían considerarse como las mejores para lanzar un nuevo producto. como su nombre lo dice.

© Universidad TecMilenio Lázaro Cárdenas #2610 Col. También empresas de Internet como Terra te llaman para ofrecerte los servicios. 2006. (ISBN 970-686-366-4). te preguntan información y posteriormente te piden datos de algún posible interesado en los servicios. Carl. 7 8 Bibliografía • Malhotra. un enfoque práctico. N.R. Naresh. Investigación de Mercados. Thomas. • Kinnear. un enfoque aplicado. México: Editorial Mc Graw Hill 1996.Universidad Tec Milenio: Profesional AM04003 – Análisis en interpretación de resultados Bola de Nieve En este método se selecciona un grupo inicial de encuestados. Investigación de Mercados. Créditos: Lic..L. México: Editorial Pearson Educación 2004. por eso del nombre bola de nieve. Investigación de Mercados. Del Paseo Residencial Monterrey. Ana María López Navarro 9 10 D. (ISBN 958-600-124-5). Bola de Nieve Un ejemplo común de este método es cuando te llaman por teléfono para ofrecerte una tarjeta de crédito. después de ser entrevistados se les pide que identifiquen a otros que pertenecen a la población de interés. • Mc Daniel. México: Editorial Thomson 2005. generalmente al azar. 2 . Este proceso es como una cadena. posteriormente te piden si puedes proporcionarles los datos de algún familiar o conocido que pudiera estar interesado en la tarjeta de crédito también. una referencia lleva a otra y así sucesivamente. (ISBN 970-26-0491-5).

© Universidad TecMilenio Lázaro Cárdenas #2610 Col. N. Selecciona cualquier número en la tabla de números aleatorios como punto de partida y encuentra el primer número que corresponda a la lista de la población. Ricardo Pérez. 3 4 Muestreo aleatorio simple Ejemplo para utilizar una tabla de números aleatorios: PASO 1. en zig-zag. 4. 3. 2006. Generar n (tamaño de la muestra) números aleatorios diferentes entre 1 y N. Muestreo probabilístico • Aleatorio simple • Sistemático • Estratificado • Por agrupamiento 1 2 Muestreo aleatorio simple Es la forma más pura del muestreo probabilístico y se realiza a partir de una lista de la población. Seleccionar un marco muestral.L.R. Luis Flores. Esto se puede hacer mediante programas computacionales o tablas de números aleatorios.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Muestreo probabilístico Cada elemento de la población tiene la misma probabilidad de ser seleccionado para la muestra. En este ejemplo hemos seleccionado el número 32 como punto de partida. El procedimiento para realizarlo es: 1. 2. Ana Sosa. Los números generados denotan los elementos que deberán incluirse en la muestra. hay cuatro tipos: AM04003-Análisis e interpretación de resultados Sesión 4. Erik Número 1 2 3 4 5 30 5 23 65 03 38 96 11 43 15 54 87 97 31 74 36 Punto de partida: Nos moveremos hacia la izquierda hasta el final de la fila. (supongamos que tenemos una lista de 30) PASO 2. Josué Bonilla. Asigna a todos los miembros de la población un número. Del Paseo Residencial Monterrey. 6 D. 1 . después hacia abajo y hacia la derecha.. 75 55 16 29 26 27 58 48 50 30 49 17 93 05 59 43 28 51 18 81 59 01 10 32 94 99 44 09 Nombre López. posteriormente hacia abajo y así sucesivamente. Asignar a cada elemento un número del 1 al N (tamaño de la población). Eva Aldape.

produce muestras casi idénticas a las generadas por el simple aleatorio. vamos a decir que ya seleccionando los puntos anteriores. El procedimiento es: PASO 4. Ejemplo: •Selecciona un número aleatorio para la página del directorio donde se comenzará. El intervalo de salto sería cada 50 personas o nombres. Del Paseo Residencial Monterrey. nuevamente a la letra “F”. saltamos 50 nombres y seleccionamos el siguiente. Ejemplo: Empezamos en la “F” de Fuentes. en este caso aparecen primero el 28.R. luego el 16 y sigue el 87. será el último de la lista al ir avanzando. como vayan apareciendo. seguiríamos seleccionado hasta llegar a la “Z”. PASO 5. 7 8 PASO 1. pero es más sencillo de aplicar. PASO 2. Alicia Muestreo sistemático El muestreo sistemático se utiliza a menudo como sustituto del muestreo aleatorio simple. en dado caso. donde continuaríamos en la letra “A” hasta llegar. este lo saltamos…llevamos por lo pronto a las siguientes personas: #28 Brito. es decir. Selecciona a la persona que corresponda a los números de la lista.. Utilizando números aleatorios. 2 . Javier #30 #16 Bonilla. empezaríamos en Fuentes.000 nombres en el directorio = 50 Muestra de 500 personas PASO 3. Erik Garza. Ejemplo: El directorio telefónico de tu ciudad. •Selecciona un número aleatorio para seleccionar la columna. que no lo incluye nuestra lista. 2006. Ejemplo: 25. Si encuentras un número que ya seleccionamos anteriormente. 11 12 D. 9 10 PASO 4. determina el punto de partida en la lista. •Selecciona un número aleatorio para el renglón de la columna donde se comenzará. N. Identifica un listado de la población que contenga un nivel aceptable de error. posteriormente el 30. Pedro. el primer nombre que se seleccionó aleatoriamente. La lista se maneja de manera circular. Pedro.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados PASO 3.L. Aplica el intervalo de salto para determinar los nombres de la lista que se incluirán en la muestra. Continuamos de la misma forma hasta completar el número completo de elementos para la muestra. Ejemplo: Si empezamos en Fuentes. Calcula el intervalo de salto dividiendo el número de nombres de tu lista entre el número de la muestra. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. simplemente lo saltamos y seguimos en la selección.

se divide en dos o más subconjuntos mutuamente excluyentes y extensivos. lo que haremos es dividir los alumnos en 2 estratos (pública y privada) y se eligen aleatoriamente 700 niños de la pública y aleatoriamente 300 de la privada. 13 14 Ejemplo: 5. Procedimiento 1. cada elemento de la población es asignado a uno de los estratos H. lo que consideramos son “conglomerados de elementos”.000 niños.. 2006. y lo que se hace es escoger algunas mesas al azar (y de ahí se toman todos los votos de las mesas seleccionadas).Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Muestreo estratificado Las muestras estratificadas son las muestras probabilísticas que se distinguen por los siguientes pasos en el procedimiento: 1. Del Paseo Residencial Monterrey. 17 18 D. con base en muestreo estratificado proporcionado o desproporcionado: H nh = n ∑ h=1 6. N. con base en la variable de calificación. Seleccionar un marco muestral. 15 16 Muestreo por agrupamiento En el muestreo por conglomerados o agrupamiento.L. seleccionar una muestra aleatorio simple de tamaño nh. 70% de los niños de primaria van a escuela pública y el 30% a privadas. La población original o principal. Las muestras simples aleatorias de los elementos de los dos o más subconjuntos se eligen independientemente una de la otra. 3 . Ejemplos: -En las encuestas durante las elecciones. Determinar el tamaño de la muestra de cada estrato. Seleecionar las variables de estratificación y el número de estratos. en lugar de considerar cada elemento de la población. Dividir la población completa en H estratos. 4. 2. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.R. En cada estrato. los conglomerados pueden ser las mesas electorales. -En otros ejemplos. los municipios. En cada estrato. (por ejemplo. nh. 3. Supongamos que en Zacatecas. etc. hombre y mujer) 2. Si queremos 1. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estará formada por TODOS los elementos de los conglomerados. los conglomerados pueden ser las colonias de viviendas. numerar los elementos del 1 al Nh (tamaño de la población del estrato H).

• Mc Daniel. un enfoque práctico. México: Editorial Mc Graw Hill 1996. N. Carl. México: Editorial Thomson 2005.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Bibliografía • Malhotra.. (ISBN 970-26-0491-5). 4 . Investigación de Mercados. Créditos: Lic. un enfoque aplicado. Investigación de Mercados.L. Naresh. (ISBN 970-686-366-4). Thomas. Ana María López Navarro 19 20 D. México: Editorial Pearson Educación 2004. Del Paseo Residencial Monterrey. Investigación de Mercados. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. (ISBN 958-600-124-5). • Kinnear.R. 2006.

L. Tamaño de la muestra • • • • • Enfoque Arbitrario Enfoque Convencional Enfoque basado en el costo Enfoque Estadístico Enfoque del Intervalo de Confianza 1 2 Enfoque Arbitrario Este enfoque se basa en una regla fija. Enfoque Estadístico En este método el tamaño de la muestra es determinado por los análisis estadísticos que van a ser utilizados. La diferencia entre el enfoque convencional y el arbitrario es que el convencional puede tener cierta lógica. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey. 2006. N. 3 4 Enfoque basado en costo Este enfoque utiliza el presupuesto disponible de la empresa para determinar el tamaño de la muestra. se usa el 5% indistintamente.. pero no es eficiente ni económico.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Métodos Existen 5 enfoques o métodos para calcular el tamaño de la muestra: AM04003-Análisis e interpretación de resultados Sesión 5. estado civil. Se analizan aspectos por edades. sexo. Este enfoque es muy fácil de aplicar. En este enfoque es importante valorar la importancia de los resultados de la investigación para la toma de decisiones. Si no hubiera costos definidos para el investigador. El número “convencional” puede ser el promedio de tamaños de muestra en estudios similares o puede ser el mismo tamaño de muestra que utilizó la competencia en un estudio similar. Enfoque Convencional Este enfoque se refiere a utilizar un tamaño “convencional” de muestra para el investigador. todo podría ser manejado con censos. 1 . 5 6 D.R. ya que ciertos análisis necesitan un mínimo de tamaño para que los resultados obtenidos sean confiables y aptos para la toma de decisiones. y el arbitrario no. donde una muestra debe ser al menos el 5% de la población total para poder ser confiable. ya que a veces es conveniente considerar un ajuste en el presupuesto. Los análisis estadísticos se utilizan para analizar subgrupos dentro de una muestra. etc.

P : Porcentaje Q : 100% . © Universidad TecMilenio Lázaro Cárdenas #2610 Col.P Punto importante: A mayor variabilidad en la población estudiada.L. 2006.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Intervalo de confianza Existe sólo un método que permite al investigador PREDETERMINAR la exactitud de los resultados de la muestra y es el de intervalo de confianza.000. Intervalo de confianza ¿Qué hemos aprendido hasta ahora? Existe una relación entre: El nivel de confianza que queremos que tengan nuestros resultados… La variabilidad de la población y… La cantidad de error muestral aceptable (precisión deseada) que queremos tener y… El tamaño de la muestra! 11 12 D. A continuación veremos cada uno de los factores considerados en este enfoque. 7 Intervalo de confianza Este método está basado en dos premisas básicas: Intervalo de confianza: Es el rango en donde las terminaciones o colas definen un cierto porcentaje de las respuestas a una pregunta. mayor será el tamaño de la muestra requerida para cumplir con un nivel de precisión estipulado. Precisión Tamaño de la muestra 9 10 Intervalo de confianza Variabilidad: se refiere a qué tan similar o diferentes son las respuestas a una pregunta dada.R. Teorema del límite central: Es una teoría que sostiene que los valores estadísticos tomados repetitivamente de la muestra en una investigación tienen una distribución normal. intervalo de confianza. N. 2 . Del Paseo Residencial Monterrey. Fórmula de error muestral : Error muestral % veces Intervalo de confianza Relación entre el tamaño de la muestra y el error muestral: Relación precisión/tamaño de la muestra Para una muestra de 1. distribución de la muestra y error estándar de la media para crear un tamaño de muestra válido. 8 Intervalo de confianza Recordamos los dos tipos de errores: – Error de No Muestreo – Error de Muestreo o error muestral: Este es el tipo de error que estaremos controlando mediante las fórmulas.000 o más se gana muy poca precisión. inclusive si se dobla la muestra a 2.. Este es de los métodos más comúnmente utilizados por los investigadores. Este método aplica conceptos de variabilidad.

mayor deberá ser el nivel de confianza. (z=1. a mayor nivel de confianza. qué tanto error están dispuestos a tolerar? – Lo convencional es ± 5%. z=2. q=50) – Estimar la variabilidad: ¿Existen estudios anteriores? ¿Se conducirá un estudio piloto? Intervalo de confianza ¿Cómo determinar el nivel de error muestral? – El investigador debe ponerse de acuerdo con los gerentes para definir esta decisión. N.. menor deberá ser el error. 2006. 15 16 Intervalo de confianza ¿Cómo determinar el nivel de confianza? – El investigador debe ponerse de acuerdo con los gerentes para definir esta decisión. 99% de confianza. mayor tamaño de la muestra. 3 . 18 D. Generalmente sucede en mercados muy especializados donde la población total es pequeña. como el mercado industrial o médico.L.R. – Entre más importante sea la decisión. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. – Lo convencional es 95%. Del Paseo Residencial Monterrey.96) – Entre más importante sea la decisión.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Intervalo de confianza Existe una fórmula que conjuga todos estos factores.58 17 Factor de corrección de la población finita Es un ajuste al tamaño de la muestra que se hace en los casos donde la muestra es igual a 5% ó más de la población total. ésta es la que considera porcentajes: n= z2(pq) e2 Intervalo de confianza Fórmula para calcular el tamaño de la muestra que considera una media: n= s2 z2 e2 Dónde: n = tamaño de la muestra z = error estándar asociado al nivel del confianza seleccionado p = porcentaje estimado de la población q = 100 – p e = error muestral aceptable 13 Dónde: n = tamaño de la muestra z = error estándar asociado al nivel del confianza seleccionado s = variabilidad indicada por una desviación estándar estimada e = error muestral aceptable 14 Intervalo de confianza ¿Cómo estimar la variabilidad ( p q ) en la población? – Esperar el peor de los casos (p=50.

México: Editorial Mc Graw Hill 1996. Ana María López Navarro 21 D. Naresh. • Kinnear. Del Paseo Residencial Monterrey. un enfoque aplicado. n’ = Donde: n’ = tamaño revisado de la muestra n = tamaño original de la muestra N = tamaño de la población 19 20 Créditos: Lic.L. 2006. Investigación de Mercados.. • Mc Daniel. (ISBN 970-686-366-4). 4 . un enfoque práctico. N. (ISBN 958600-124-5). Carl. (ISBN 970-26-0491-5).R. Investigación de Mercados.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Factor de corrección de la población finita Este cálculo se hace utilizando la siguiente fórmula: nN N+n-1 Bibliografía • Malhotra. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Thomas. México: Editorial Thomson 2005. Investigación de Mercados. México: Editorial Pearson Educación 2004.

12. Planeación del trabajo de campo 1.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Planeación de las operaciones de campo Como contexto general. 8. asignar un fondo de reserva para cubrir contingencias imprevistas. 5 6 D. 2. Debe estar muy clara la calendarización del proyecto. 7. 3 4 Programación del tiempo Cuando son proyectos muy largos. Del Paseo Residencial Monterrey. existen cuatro aspectos que son comunes en las operaciones de campo: AM04003-Análisis e interpretación de resultados Sesión 6. 2006. los costos están directamente relacionados. Hay que detallar lo mejor posible cada uno de los rubros. ya que a veces los proyectos se atrasan por fijar metas inalcanzables. 5.R. 3. 10. Borrador del cuestionario de prueba Seleccionar la muestra de prueba Seleccionar los entrevistadores de prueba Preparar el material de capacitación Capacitar a los entrevistadores Realizar entrevistas de prueba Evaluar los resultados de la prueba Afinar cuestionario según resultados de prueba Seleccionar personal de campo Preparar material de capacitación Capacitar personal de campo Realizar entrevistas Validación del trabajo de campo Evaluación del personal de campo Informe final de campo 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 OCTUBRE 1 2 3 4 5 6 7 NOVIEMBRE Es necesario detallar el número de días para cada actividad pero que sean realistas. ya que deben cumplirse los tiempos establecidos. 9. y otras específicas por actividades o bloques de actividades.L. ya que un cambio en alguna actividad afecta a otra y el presupuesto se puede ver modificado. 11. y si es necesario. 13. es necesario realizar una gráfica general. 4. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. 3. 15. 6. Presupuesto Se deben asignar costos a cada una de las actividades del programa. N. 2. 1 . Programación del tiempo Presupuesto Trabajadores de campo Medición del desempeño 1 2 Programación del tiempo Cualquier proyecto debe incluir una programación del tiempo que especifique: • Comienzo e inicio del proyecto • Secuencia de actividades dentro del tiempo especificado (usualmente se utiliza una gráfica de Gantt) ACTIVIDADES Programación del tiempo Ejemplo: 1. 14. 4..

(ISBN 958600-124-5). Total de encuestados elegibles 1. A continuación se presenta un ejemplo en el caso de entrevistas: 9 Medición del desempeño Ejemplo tabla de evaluación.1 Entrevistas 1. 2006. Pero existe otra información importante como rechazos. indicadores esperados y reales: MEDIDA DE DESEMPEÑO 1.3 Tasa de contactos 3. por ejemplo.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Presupuesto Para un estudio basado en entrevistas personales. Es necesario que el personal entienda claramente sus responsabilidades y la forma de medir su desempeño. Investigación de Mercados.2 Rechazos 1. 8 Medición del desempeño Es necesario tener un control por escrito para poder evaluar el desempeño individual del personal. y cada uno de ellos tiene sus particularidades. por el número realizado. es necesario realizar una cuidadosa selección y capacitación para poder exigir tiempos y el cumplimiento de adecuado de las actividades. 7 Personal El éxito del trabajo de campo depende principalmente en la calidad del personal. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.R.L.2 Otro (especifique) 3.1 Se mudaron 2.4 Otro (especifique) 2. casos de ausencia.2 Tasa de rechazos 3. Muchas veces en caso de cuestionarios se evalúa por encuesta respondida. etc. 2 . N.. con la cual pueden hacerse comparaciones interesantes. Del Paseo Residencial Monterrey.1 Tasa de respuestas 3. Los métodos son: •Entrevista personal •Entrevista telefónica •Entrevista por correo •Entrevista por computadora •Observación Bibliografía • Kinnear. o en el caso de entrevistas. México: Editorial Mc Graw Hill 1996. 11 12 D. Total de encuestados no elegibles 2. un enfoque aplicado. Muestra total 3..4 Tasa de elegibilidad ESPERADO REAL % % % % % % % % 10 Métodos de recolección de datos Existen diferentes métodos para la recolección de datos en una investigación.3 No contactos 1. Se requieren mediciones claras y fáciles de entender. las principales categorías de costos son: • Sueldos y salarios administrativos • Materiales y suministros • Teléfono • Supervisores de campo o servicios por entrevistas • Salario de entrevistadores • etc. Thomas.

3 . Del Paseo Residencial Monterrey.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Créditos: Lic. 2006. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.L. N. Ana María López Navarro 13 D.R..

Selección de los trabajadores de campo Por lo cual. Entre mayor afinidad exista entre el personal de campo y el entrevistado.R. antes de seleccionar al personal. de acuerdo al método de recopilación de datos. 5 6 D. Muchas veces no se debe preguntar al entrevistado si desea participar o no. por esto es muy importante capacitar al personal para que realice comentarios que inviten a participar en el estudio. Hay que saber manejar objeciones y ser proactivos en la investigación. 1 . Contratar al personal. Definir las características necesarias en el personal de campo. antecedentes. ya que las características . es mayor la probabilidad de que la investigación sea exitosa. como: • Primer contacto • Realización de preguntas • Sondeo • Registro de respuestas • Conclusión de entrevista Primer Contacto En el primer contacto se decide si el entrevistado coopera o no en la investigación. debemos definir los siguientes aspectos: – – – Establecer los requerimientos del proyecto. Trabajo de campo y recopilación de datos Capacitación de los trabajadores de campo Supervisión de los trabajadores de campo Validación del trabajo de campo Evaluación de los trabajadores de campo 1 2 Selección de los trabajadores de campo El primer paso en el proceso de trabajo de campo es la selección.. N. y actitudes del personal de campo afectan en las respuestas de los entrevistados. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.L. ya que de eso dependen resultados uniformes durante la investigación. sino más bien ser asertivos y dar la pauta para empezar la entrevista. Del Paseo Residencial Monterrey. 3 4 Capacitación de los trabajadores de campo Es muy importante tener bien capacitado al personal.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Proceso del trabajo de campo y recopilación de datos Selección de los trabajadores de campo AM04003-Análisis e interpretación de resultados Sesión 7. Se deben especificar todos los aspectos del método a utilizar. 2006.

no se debe interpretar. 6. Esto puede alentar a que el entrevistado complete más su respuesta. aclaren o expliquen sus respuestas. entonación. 2. Seguir las indicaciones y esquemas de salto. 7. Tranquilizar o impulsar al entrevistado. Conocer a fondo el cuestionario 2. “No comprendo bien su respuesta. En el caso de que el entrevistado dude de sus respuestas. Leer cada pregunta pausadamente.L. 9 10 4. esto puedo estimular la respuesta. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Algunos comentarios que se utilizan para sondear se abrevian a lado de cada pregunta. Repetir la respuestas del entrevistado. 5. ¿sería tan amable de decirme algo más por favor? 11 6. N. cualquier cambio en la redacción de la pregunta. 5. Plantear las preguntas en el orden que aparecen en el cuestionario exclusivamente. Del Paseo Residencial Monterrey. Repetir la pregunta. Si la persona entrevistada quiere que se le explique alguna pregunta. ¿Por qué opina así? (POA). Hacer todas las preguntas aplicables. esto sirve para alentar al entrevistado para que detalle más de sus propios comentarios. ¿Alguna otra razón? (AO) 12 D. Utilizar exactamente las palabras que están descritas en el cuestionario. Hacer una pausa o silencio. en el orden.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Realización de preguntas Realizar preguntas correctamente no es una tarea fácil. Estimular las aclaraciones. Es de vital importancia capacitar al personal y dar todos los detalles para preguntar de manera uniforme y sin sesgar al entrevistado. 8 7 Sondeo Sondear significa motivar a los entrevistados para que elaboren. 3. se le debe indicar “no existen respuestas buenas o malas. pero esto no debe en tanto no sea incómodo.R. 3. 2006. A continuación se presentan algunos lineamientos para hacer preguntas: Realización de preguntas 1. 2 . Para que el entrevistado aclare más sus respuestas se le pueden mencionar frases como.. Hacer comentarios y preguntas neutras. A continuación se presentan algunas técnicas comumes de sondeo: Sondeo 1. 4. puede alterar su significado y sesgar la respuesta. ¿Algo más? (AM). sondear cuidadosamente. Repetir las preguntas que no haya sido entendidas. deben ser objetivos y neutros como. también es útil para ubicar al entrevistado en el contenido de la entrevista y que sólo proporcione información relacionada al estudio. queremos su opinión solamente”. se le comenta “lo que signifique para usted”.

por lo tanto debe de tener indicaciones explícitas de cada punto. Registro de las preguntas Por ejemplo. 5. La supervisión abarca: • Control de calidad y correcciones • Control del muestreo • Control de fraudes • Control de la oficina central 15 16 Validación del trabajo de campo Se deben verificar al azar del 10 al 25% de los cuestionarios o entrevistas. Repita la respuesta mientras la escribe. Evaluación de los trabajadores de campo Se debe evaluar a los trabajadores de campo en base: • Costos y tiempos • Tasas de respuesta • Calidad de la entrevista • Calidad de los datos 17 18 D. 14 13 Conclusión de entrevista La entrevista no debe darse por concluida si se encuentra incompleta. No resuma ni parafrasee las respuestas abiertas. Del Paseo Residencial Monterrey. 3 . Incluya todo lo que concierna a los objetivos de la pregunta. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. 3. tiene los siguientes lineamientos: 1. N. Todos los entrevistadores lo deben de hacer en la misma forma. 2. el “Survey Research Center” en la ciudad de Michigan. es importante darle las gracias y expresar su aprecio. la calidad. Utilice las mismas palabras que el entrevistado. Supervisión de los trabajadores de campo Significa asegurarse de que se estén aplicando las técnicas y procedimientos que se indicaron en la capacitación. El entrevistador no debe responder ninguna pregunta relacionada con el estudio. Como regla general. 2006. Incluya todos los sondeos y comentarios.R. la duración de la entrevista.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Registro de las preguntas Se debe especificar claramente el formato en el cual se deben registrar las preguntas. las respuestas abiertas se deben de registrar literalmente. La información demográfica se cruza con la registrada para verificar la autenticidad de las entrevistas. y datos demográficos básicos. 4.L. donde se pregunte si efectivamente el entrevistador realizó las preguntas. Cada encuesta o entrevista es diferente. Anote las respuestas durante la entrevista. 6.. El entrevistado debe llevarse una sensación positiva.

México: Editorial Pearson Educación 2004. un enfoque práctico. Investigación de Mercados. (ISBN 970-26-0491-5). Ana María López Navarro 19 20 D. Créditos: Lic. Investigación de Mercados.R. • Kinnear. 2006. México: Editorial Thomson 2005. • Mc Daniel. (ISBN 970-686-366-4). N. Thomas. un enfoque aplicado. (ISBN 958600-124-5).L. México: Editorial Mc Graw Hill 1996.. Carl. 4 . Investigación de Mercados. Naresh. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Bibliografía • Malhotra. Del Paseo Residencial Monterrey.

1 . AM04003-Análisis e interpretación de resultados Sesión 8. 2. entonación. Por ejemplo. Esto muchas veces se da debido a que se paga por encuesta o entrevista completada. no es lo mismo preguntar. 4. 3. Errores del trabajador de campo Intencionales Guiar a una respuesta Este ocurre cuando el trabajador de campo concientemente está guiando al entrevistado a que le responda algo en específico. veremos este tema con mayor detalle. Errores no-intencionales Características del entrevistador Malentendidos Fatiga Errores intencionales 1. Malentendidos Supuestos Pérdida de atención Distracciones Fatiga 3 4 Errores del trabajador de campo Intencionales Fraude Este ocurre cuando el trabajador de campo concientemente no está incluyendo información representativa de la muestra. N. 5. ¿Acaso no es el tema del gas un problema para usted? 5 6 D. parafraseo de preguntas. Puede ser que esté dando información falsa o que escoja a las personas que más se le faciliten. lenguaje corporal o inclusive el parafraseo de un reactivo. Errores en la recolección de datos de campo El error de no muestreo incluye lo siguiente: • Todos los tipos de error que no sean de muestreo • Errores en la recolección de datos • Errores en el manejo de los datos • Errores de análisis • Errores de interpretación 1 2 Errores no-muestrales También se incluyen errores en la definición del problema. 2006. que guiar la pregunta como.Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados Errores en la recolección de datos de campo El error de muestreo es sólo uno de los dos tipos de error que afectan una investigación. Puede ser mediante la pronunciación. no las que debe seleccionar. 2. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. a continuación se presenta una clasificación de los errores no-muestrales: Errores del trabajador de campo Error de los entrevistados Errores intencionales 1. Por lo cual.. Del Paseo Residencial Monterrey. ¿Es el tema del gas un problema para usted?. Fraude Guiar a una respuesta 1. pero generalmente el mayor potencial de error no-muestral se encuentra en la etapa de recopilación de datos. 2. Respuestas falsas No respuesta Errores no-intencionales 1.R. 3. 2.L.

como saltar una pregunta en caso de cierta respuesta. pero en realidad lo hace incorrectamente. por lo cual la gente se fatiga. N. 11 12 D.. esto se da cuando el personal de campo ya se encuentra cansado. se tienen que considerar todos lo factores. la edad. el ingreso que recibe una persona. o comportamiento. como el sexo. Del Paseo Residencial Monterrey. diferentes tipos de escala. muchas veces las personas tienen prejuicios de acentos de ciertas regiones. el personal de campo puede estar menos alerta y descuidar aspectos de la investigación. cree que comprende bien como administrar la investigación. Por ejemplo.R. 7 Errores del trabajador de campo No-Intencionales Malentendidos En este tipo de error ocurre cuando el personal de campo. Errores de los entrevistados No-Intencionales Malentendidos Es cuando el entrevistado proporciona una respuesta sin comprender la pregunta planteada o el contexto. Bajo ciertas circunstancias el hecho de que el trabajador de campo sea hombre o mujer influye en los resultados según el tema que se esté investigando. El trabajo de campo puede ser muy repetitivo y monótono. 2006. En una investigación por teléfono.Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados Errores del trabajador de campo No-Intencionales Características del entrevistador En este tipo de error influencian las características personales del trabajador de campo. no netos. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. En las entrevistas por teléfono puede influenciar mucho el acento. por ejemplo. es muy común este problema. o profundizar más en algunas preguntas. instrucciones de cómo registrar las respuestas de los entrevistados y otros procedimientos que deben ser comprendidos. y es cuando los entrevistados no proporcionan respuesta a un reactivo determinado. como por ejemplo. Las negativas a participar en una investigación son problemas que el investigador debe enfrentar. y esta diferencia puede reflejarse en una problema de comunicación. Al final de un largo día de entrevistas.L. 8 Errores del trabajador de campo No-Intencionales Fatiga El tercer error no intencional es referente a la fatiga. una persona puede estar respondiendo en términos brutos. o cuestiones de higiene personal. ya sea por proteger su intimidad o por vergüenza. 10 Errores de los entrevistados Intencionales No respuesta Este es el error intencional que más se da en una investigación. Puede descuidar patrones de respuesta. Existen ciertos temas que son más propensos que otros a recibir respuestas falsas. acento. en una investigación donde se requieren cantidades después de impuestos. 2 . El cuestionario puede incluir instrucciones. 9 Errores de los entrevistados Intencionales Respuestas falsas Este tipo de error ocurre cuando el entrevistado no proporciona información veraz. Existe una diferencia en educación muy considerable entre los diseñadores de la investigación y el personal de campo. o hacerlo más rápido y con menos detalle por la prisa de terminar.

Por ejemplo. entrevistado no está interesado en la investigación como está el investigador. En el caso de una encuesta en un centro comercial puede ser que el entrevistado salude a algún conocido o familiar. un enfoque aplicado. Cuando esto sucede. Del Paseo Residencial Monterrey. (ISBN 958600-124-5). Por ejemplo. por lo que conforme avance cuestionario o entrevista cada vez se pierde más y más interés. Alvin. • Burns. 15 16 Bibliografía • Kinnear.R.. Investigación de Mercados. Ana María López Navarro 17 18 D. N. México: Editorial Mc Graw Hill 1996.L. las respuestas que se proporcionan ya no son reflexionadas. Errores de los entrevistados No-Intencionales Fatiga Es cuando el entrevistado se cansa de participar en la investigación. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. “no respuesta”. Créditos: Lic. en lugar de ver el recibo de agua y dar el dato verídico. a fin de terminar pronto. puede ser que al entrevistar a una madre de familia por teléfono la interrumpa el bebé o alguno de sus hijos. 2006. Marketing Research. Thomas. 13 Errores de los entrevistados No-Intencionales Pérdida de atención Es cuando el interés del entrevistado decae.Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados Errores de los entrevistados No-Intencionales Supuestos Es cuando el entrevistado proporciona una respuesta de la cual no está seguro de su veracidad y está haciendo un supuesto de la información. 3 . (ISBN 0-13-014411-8). Por ejemplo. puede ser que en un cuestionario la persona tienda más a seleccionar la categoría de NR. el lo el el 14 Errores de los entrevistados No-Intencionales Distracciones Es cuando ocurren distracciones o interrupciones durante la entrevista. Estados Unidos: Editorial Prentice Hall 2000. en una pregunta como: ¿Cuánto fue el consumo en su hogar de agua el mes pasado en litros? Muchas personas podrían suponer la cantidad que se le está preguntando.

R. Hay varias formas de hacer esto. en una encuesta.. En el caso de las entrevistas personales el supervisor puede ir de observador para evaluar el procedimiento. Cabe mencionar que no se eliminan en su totalidad. Las estrategias de control se resumen en la siguiente tabla: 1 2 AM04003-Análisis e interpretación de resultados Sesión 9. N. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. 5 6 D. Cómo minimizar los errores en la recolección de datos de campo Cómo controlar (minimizar) los errores Tipos de error Errores del trabajador de campo Errores intencionales Errores no-intencionales Error de los entrevistados Errores intencionales Respuestas falsas Asegurar anonimato y confidencialidad Incentivos Chequeos de validación Técnica de la tercera persona Asegurar anonimato y confidencialidad Incentivos Técnica de la tercera persona Cuestionario bien redactado Preguntas directas Cuestionario bien redactado Opciones de respuesta (respuestas cerradas) Escalas de diferencial semántico Utilizar apuntadores de avance (frases de ánimo) Fraude Guiar a una respuesta Supervisión Validación Mecanismos de control Estrategias de control para evitar errores del trabajador de campo Intencionales Existen dos estrategias que se pueden utilizar para evitar los errores intencionales por parte del trabajador de campo: • Supervisión • Validación Características del entrevistador Malentendidos Fatiga Selección y entrenamiento de los entrevistadores Sesiones de orientación y simulación de roles Descansos e investigaciones alternas No respuesta Errores no-intencionales Malentendidos Adivinar respuestas Pérdida de atención Distracciones Fatiga 3 4 Supervisión Validación En la supervisión se utiliza una persona para vigilar el trabajo de campo. en las entrevistas telefónicas se les escucha o graba para ver si el entrevistador no está sesgando las preguntas o si está entrevistando a las personas de la muestra. afortunadamente existen también estrategias de control que podemos utilizar para minimizar estos errores. Del Paseo Residencial Monterrey. 2006. Por ejemplo. a pesar de que existen muchos factores de error en la recolección de datos de campo.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Estrategias de control en la recolección de datos de campo Como hemos visto. En la validación se verifica que el trabajador de campo haya hecho el trabajo requerido.L. 1 . se contacta nuevamente a la persona para ver si efectivamente participó en la investigación. sólo podemos disminuir su efecto. por ejemplo.

se puede alternar a los trabajadores. Es importante ser firmes en los descansos designados. 2006. Otra estrategia es ofrecer incentivos. 12 11 D. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. aún y que el trabajador de campo no los crea necesarios. pero haciendo alusión a todos los requisitos de la investigación.L.R. es que una persona con experiencia en el campo observe los cuestionarios y detecte si hay algún patrón inconsistente de respuestas. como en el caso de personas muy jóvenes y una gran número de hijos. regalos. En estas sesiones se debe ser claro respecto a los patrones de salto de respuestas. etc. 2 . Existen tres mecanismos de control para controlar los errores de campo no-intencionales: • Sesiones de orientación • Simulación de roles • Descansos 7 8 Sesiones de orientación Simulación de roles Son reuniones en las cuales se orienta a los trabajadores de campo respecto al cuestionario y se les explican los procedimientos de administración. para evitar que se fatiguen con la monotonía de un mismo estudio. Otra forma de validar. También es conveniente realizar algunas preguntas nuevamente para comparar los resultados. como cupones. etc.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Estrategias de control para evitar errores del trabajador de campo No-Intencionales El número estándar que se debe validar es el 10% de la muestra. ya sea económicos. Del Paseo Residencial Monterrey. descuentos. 9 10 Descansos Con los descansos se pretende evitar la fatiga en los entrevistadores y evitar errores por esta cuestión. y anonimato. Se trata de actuar como si fuera una entrevista real. Estrategias de control para evitar errores de los entrevistados Intencionales Para controlar este tipo de errores. que son información falsa o falta de respuesta. alguna instrucción especial o el formato de aplicación del cuestionario. De esta forma el entrevistado se sentirá más comprometido a decir la verdad ya que esté siendo remunerado por su participación.. La simulación de roles tiene el propósito de que el entrevistador se familiarice con el cuestionario y se le oriente de manera práctica cómo resolver algún problema en la administración del mismo. En caso de tener varias investigaciones al mismo tiempo. es importante ofrecer confidencialidad de la información proporcionada por el entrevistado. o algún tipo de recompensa. que su nombre no pueda ser asociado con la información proporcionada. N.

es recomendable utilizar apuntadores de avance. pedirle una identificación.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados También se puede utilizar validación de pruebas. en cuestionarios o entrevistas muy largas. etc. (ISBN 0-13-014411-8). ofrecer alternativas como “Indiferente”. 2006.. cuando hay opciones de respuesta.respuesta El error de no-respuesta por parte del entrevistado. ya que esto evita que las personas hagan supuestos de la información y adivinen las respuestas. que son Malentendidos. Estrategias de control para evitar errores de los entrevistados No-intencionales Otra táctica es utilizar escalas de diferencial semántico. “Sin respuesta”. Investigación de Mercados. para reducir el error. N. y si el grado se considera un problema. pedirle un comprobante. Si la persona dice tener cierta edad. 3 . existen dos métodos de compensación: • Promedios ponderados • Sobremuestreo 17 Bibliografía • Kinnear.L. • Burns. (ISBN 958600-124-5). es de lo más común. Por ejemplo. Por último. Por último. podemos utilizar la técnica de la tercera persona. 15 16 Ajuste de resultados para reducir el error de no. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. se deben realizar ajustes. entonces no existe una razón para hacer ajustes.R. etc. sobre todo en temas que pueden ser vergonzosos para algunos. Del Paseo Residencial Monterrey. “¿Piensa usted que alguna persona de su misma edad y condición física podría utilizar medicamentos tomados para evitar la calvicie?” 13 14 Estrategias de control para evitar errores de los entrevistados No-intencionales Para controlar este tipo de errores. o frases de ánimo. Pérdida de atención. es importante ofrecer cuidar el diseño de un cuestionario. Adivinar respuestas. según el caso. si este factor no es significativo. esto es preguntar al entrevistado en términos de alguien más. “Ya estamos por terminar”. Thomas. México: Editorial Mc Graw Hill 1996. “Respuesta dudosa”. un enfoque aplicado. se deben ofrecer ejemplos en caso necesario. En el caso de necesitar ajustes. Distracciones y Fatiga. si el entrevistado responde que utiliza cierto tipo de vitaminas. por ejemplo. Alvin. como: “Acabamos de terminar la parte más complicada de la investigación”. por lo cual siempre debe ser cuantificado. si queremos el domicilio o colonia. y no cargar las respuestas afirmativas o negativas de un solo lado. Estados Unidos: Editorial Prentice Hall 2000. pedirle que muestre el frasco. Marketing Research. 18 D.

2006.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Créditos: Lic.R. 4 . © Universidad TecMilenio Lázaro Cárdenas #2610 Col. N. Del Paseo Residencial Monterrey.L. Ana María López Navarro 19 D..

Codificación AM04003-Análisis e interpretación de resultados Sesión 10. Del Paseo Residencial Monterrey. si se siguieron los patrones de salto. Validación y edición La validación se refiere al proceso de verificar que las entrevistas se hayan realizado de acuerdo a las indicaciones establecidas.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados 1. etc. Sobre todo las omisiones. Tabulación y análisis 1 2 1.. Es muy tedioso este proceso. Introducción de datos 4. Procesamiento de datos 3. Lo más recomendable en estudios grandes es tener precodificada la mayor parte de la información. 2. Se verifican tanto los errores intencionales como los intencionales por parte del entrevistador y el entrevistado. Validación y edición 2.L. 3 4 Ejemplo de una encuesta pre-codificada Procedimiento para codificación de datos general Revisar respuestas a preguntas cerradas Asignar claves a preguntas cerradas Iniciar captura Definir claves para cada pregunta cerrada del cuestionario vacío. En muchos cuestionarios las respuestas ya están precodificadas. N. Limpieza de los datos 5. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. puesto que a veces son miles de páginas por verificar. 1 .R. 2006. Integrar el catálogo de claves Revisar respuestas a preguntas abiertas Integrar por separado claves para preguntas abiertas Asignar claves a preguntas abiertas 5 6 D. Codificación Se refiere al proceso de agrupar y asignar códigos numéricos a las posibles respuestas de una pregunta dentro de un cuestionario o entrevista. pero es algo que se debe realizar para garantizar la calidad de los resultados.

17. 2. 2006. 6.L. 14. Esto es en el caso de preguntas abiertas. como SPSS (ejemplo de pantalla). como cd. 7 8 Ejemplo de respuestas a pregunta abierta codificada: ¿Por qué le gusta tomar Coca-Cola? 3. donde se tiene que ver las respuestas que se van dando y agrupar las que se repiten. Introducción de datos Es el proceso de convertir la datos a un formato electrónico. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. 4. se listan las que van saliendo nuevas y si se repiten se añaden al conteo de las respuestas registradas. Introducir los códigos. 15. y nos sirve para poder procesarlos y obtener información relevante del estudio para la toma de decisiones. 12. 18. 11. 9. 2. Se asigna el código numérico a cada respuesta final. Consolidar las respuestas. Realizar un listado de respuestas. Este proceso requiere de un dispositivo para la introducción de datos. Determinar los códigos. 4.. por mencionar algunos. 5. Minitab. 10. 2 .R. 8. N. 19. Del Paseo Residencial Monterrey. Porque sabe bien Porque me gusta Por la publicidad Porque le gusta a mi esposo/a Es la que más se vende Es la que siempre encuentro a la mano Porque te la traen a domicilio Estoy acostumbrado Es un hábito Es la que beben todos mis amigos Porque está en oferta Tenía promoción Por inercia La bebo desde que era niño Me ayuda con el dolor estómago Me reanima cuando me siento mal No hay ninguna razón en particular No sé No tengo idea 10 3. como una computadora y un medio de almacenamiento. disco duro. etc. SAS. 13.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Proceso de codificación para respuestas abiertas Ejemplo de libro de códigos 1. 3. El más utilizado en el mercado de investigación de mercados es el SPSS. es como realizar un catálogo. Varias respuestas se pueden agrupar en una misma categoría. Excel. 16. 11 12 D. Generalmente los datos se introducen en un paquete estadístico. 7. pero esto lo tiene que decidir un investigador calificado y muchas veces se decide también con el cliente. 9 1.

Se utilizan técnicas que en principio son para cálculo estadístico pero que nos dan pistas de los posibles problemas. 13 14 • Existen comprobaciones generales en la hoja de cálculo: – Líneas repetidas (SPSS 12 tiene un comando para – esto) – Casillas en blanco – Valores repetidos • Utilizando técnicas estadísticas. Limpieza de datos En esta parte ya se han introducido los datos a la computadora y es el momento de realizar una verificación final de errores antes de continuar con el análisis estadístico. 3 . © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Estas técnicas son diferentes para variables categóricas o numéricas y también nos permiten ver si hay errores de captura.R. están listos para tabularse y realizar análisis estadísticos.60 mts. 2006.. También histogramas 15 16 Diagramas de dispersión para dos variables 5. Las tres grandes ramas de tipos de análisis que estaremos viendo en los siguientes módulos son: 17 18 D. Tabulación y análisis estadístico Ya que los datos han sido introducidos a la computadora y están libres de errores de captura. Podemos controlar varios aspectos en los datos: – Valores perdidos – Casos repetidos – Valores imposibles: Sexo varón. N. • Categóricas – Frecuencias para una variable – Cruces de Frecuencias para más de una variable • Numéricas – Máximos y mínimos para variables numéricas. Del Paseo Residencial Monterrey. los valores implausibles pueden ser valores legítimos y necesitan ser investigados con detalle.L.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados 4. dos embarazos – Valores implausibles: Altura 1. peso 100 kilos Los valores imposibles deben ser corregidos.

L. Ana María López Navarro 21 D. Naresh. (ISBN 958600-124-5).. Investigación de Mercados. Investigación de Mercados. 2006. Thomas. (ISBN 970-26-0491-5). México: Editorial Thomson 2005. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. un enfoque práctico. 4 . Carl. Análisis univariado de datos Análisis bivariado de datos Análisis Multivariado de datos 19 20 Créditos: Lic. • Kinnear. un enfoque aplicado. Investigación de Mercados. Del Paseo Residencial Monterrey. N.R. México: Editorial Pearson Educación 2004. (ISBN 970-686-366-4). México: Editorial Mc Graw Hill 1996. Más de dos Una ¿Cuántas variables van a utilizarse a la vez? Dos • Mc Daniel.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Bibliografía Inicio • Malhotra.

© Universidad TecMilenio Lázaro Cárdenas #2610 Col. en Tipos de Análisis de Datos Univariados Propiedades Técnicas Estadísticas • Descriptiva. Tales como: Pruebas z. Del Paseo Residencial Monterrey. Estadísticas que permiten hacer juicios acerca de la población total basado en resultados generados por las muestras.L. Análisis univariado de datos: Estadística descriptiva Estrategia de Análisis •Número de variables a analizar simultáneamente Univariado. Estadísticas que proporciona medidas resumidas de los datos en sus muestras. t y ji cuadrada 6 5 D. 2006. Tales como: Medidas de Tendencia Central y Dispersión • Inferencial. • Se utiliza cuando hay una medida única de cada elemento de la muestra o en caso de tener dos o más mediciones de los elementos cada variable se analiza por separado. método y diseño •Antecedentes y filosofía del investigador 3 ¿Cuántas variables se analizarán simultáneamente ? 1 2 Más de 2 Univariado Bivariado Se enfoca en: Multivariado Niveles (promedio) Distribución (desviación) Grado de relaciones (correlaciones y covarianzas) 4 Análisis univariado • Es el análisis de una variable de manera individual.. Bivariado o Multivariado •Propiedades de las técnicas estadísticas Descriptivas o Inferenciales •Conocer características de los datos Escalas de medición de acuerdo al tipo de datos •Consideraciones durante el proceso de investigación Definición del problema. 1 .Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Análisis de Datos PROCESO DE PREPARACION DE DATOS Revisión del Cuestionario Edición Codificación Transcripción Depuración de datos Ajuste estadístico Estrategia de Análisis 1 2 AM04003-Análisis e interpretación de resultados Sesión 11. N.R. • Los datos pueden analizarse solos o agrupados categorías o clases (frecuencias).

• Se representa con: S o con la letra sigma σ • MODA 12 D. Es lo que se conoce como "promedio".344 / 64 = 21 9 Los datos se ordenan de manera creciente o decreciente.R.16. Observación X1 X2 X3 X4 X5 Valor de Xi 15 26 Mediana 71 84 102 = 1. • Se utiliza con datos de Intervalo.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Procedimientos univariados Las estadísticas que se utilizan para analizar los datos univariados van de acuerdo a la escala y el tipo de información que queremos obtener: Medida de Tendencia Central Moda Mediana Media Medidas de tendencia central: media Es la suma de los valores dividido por el tamaño de la muestra. Del Paseo Residencial Monterrey. • Se utiliza con los datos de escala ordinal o de intervalo.11 y 9 = 63/5 = 12. 2006. Categoría/ Edad 25 a 30 años 30 a 35 años 35 a 40 años Mas de 40 Totales Numero de personas fi 8 16 24 16 64 11 Medidas de dispersión: Desviación Estándar • Indica cuánto tienden a alejarse los valores puntuales del promedio. Se usa con datos de intervalos Escala Nominal Ordinal Intervalo Medida de Dispersión Frecuencias Rango intercuartil Desviación estandar 7 Ejemplo: Valores: 12. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.6 8 También se puede utilizar cuando los datos de intervalo se agrupan en categorías o clases (frecuencias). N.15. Categoría/Edad 25 a 30 años 30 a 35 años 35 a 40 años Mas de 40 Totales No. • Una desviación estándar grande indica que los puntos están lejos de la media y una desviación pequeña indica que los datos están agrupados cerca de la media. • Se utiliza con datos de escalas nominales o de orden superior. 10 Medidas de Tendencia Central: Moda • Es la categoría de una variable nominal que ocurre con mayor frecuencia.344 Medidas de Tendencia Central: Mediana • Es el valor medio cuando los datos se agrupan en orden de magnitud. 2 ..L. de personas fi 8 16 24 16 64 Punto medio Xi 14 18 22 26 fiXi 112 288 528 416 1.

Carl. N. México: Editorial Mc Graw Hill 1996. • La distribución de frecuencias es hacer un conteo del numero de respuestas asociadas con diferentes valores de la variable. 3) S= Raíz cuadrada de 654/8 4) S= 25. Son los números de la muestra que aparecen en cada categoría de la variable nominal. Pueden ser: Absolutas.12. Créditos: Lic.. bivariado y multivariado).57 13 Relativas. Son los porcentajes de los elementos totales que aparecen en cada categoría. (ISBN 970-26-0491-5).Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Datos: 20.L. Investigación de Mercados. y para determinar cuales estadísticos debemos conocer el tipo de ESCALA de los datos (intervalo. • Mc Daniel. (ISBN 958600-124-5).X)2 (20-19)^2= (36-19)^2= (30-19)^2= (24-19)^2= (6-19)^2= (12-19)^2= Total 1 289 121 25 169 49 654 Medidas de dispersión: Frecuencias • La frecuencia es la repetición de un proceso. Thomas. • En el análisis univariado Descriptivo utilizamos medidas de TENDENCIA CENTRAL y de DISPERSION .30. 3 . • Kinnear. México: Editorial Pearson Educación 2004.R.10. ordinal o nominal). 15 16 Bibliografía • Malhotra. Investigación de Mercados. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. un enfoque práctico. Ana María López Navarro 17 18 D. 14 Medidas de dispersión: Frecuencias Ejemplo.2 6% 8% 4% 1% 100% f absoluta / n ¿Qué hemos aprendido? Debemos elegir una técnica estadística en función a: • El número de variables a analizar simultáneamente (análisis UNIVARIADO. • Tipo de información estadística deseada: DESCRIPTIVA (descripción de la muestra) e Inferencial. un enfoque aplicado.7% 22. México: Editorial Thomson 2005.14 1) Determinar la media = 19 2) Raíz Cuadrada de los cuadrados de las desviaciones de los datos de la media (x. Se utilizan en Datos de Escala Nominal. ¿Cuántas veces por semana consume leche? xi 0 1 2 3 4 5 6 7 f absoluta 8 18 25 20 6 8 4 1 n = 90 F relativa 8. 2006. Del Paseo Residencial Monterrey. Investigación de Mercados.24.88% 20% 27. (ISBN 970-686-366-4).36.6. Naresh.

en caso de tener una dirección (> o <). 1 . Prueba de Hipótesis: Procedimiento basado en la evidencia muestral y la probabilidad. Ejemplo. 1 2 AM04003-Análisis e interpretación de resultados Sesión 12. 5 1.Formular hipótesis nula y alternativa 2. Formular Hipótesis Las pruebas pueden ser bilateral o de 2 colas o unilateral.Determinar la probabilidad: valor critico 6. de acuerdo al tipo de información. 2006. podemos dividir la estadística en dos categorías. Análisis Univariado Inferencial: Prueba de Hipótesis Prueba de Hipótesis Con frecuencia no es suficiente describir lo que aparece en la muestra. es decir. Para estimar el consumo de leche en Monterrey. 3 Pasos Prueba de Hipótesis 1. Es una aseveración de una población con el propósito de verificar si la afirmación es razonable en función a los datos de la muestra.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Análisis Univariado Inferencial Como vimos en la sesión anterior. La hipótesis nula es la que siempre se pone a prueba. Para hacer un análisis inferencial. supone que un parámetro de población adquiere determinado valor o conjunto de valores.. sino se requiere hacer inferencias de la muestra con respecto a la población de la cual se tomó. Alternativa ( H1 ) Enunciado en el que se espera alguna diferencia o efecto (opuesto a la hipótesis nula). debemos conocer las Pruebas de Hipótesis.Calcular la estadística de prueba 5.Determinar Nivel de significancia 4. Del Paseo Residencial Monterrey. Estadística Inferencial nos permite hacer juicios acerca de la población total basado en resultados generados por las muestras. N.L. 6 D. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Formular Hipótesis Hipótesis Nula ( H0 ) Enunciado del estado en que se encuentran las cosas y en el que no se espera ninguna diferencia ni efecto. la estadística descriptiva e inferencial.Elegir la estadística de prueba 3.Comparar valor critico y tomar decisión No se rechaza HO Se rechaza HO 4 1.R. una muestra aleatoria puede someterse a investigación Con base en estos resultados muestrales puede estimarse el consumo de la población. una cola.

2006. . Elegir la Estadística de Prueba La estadística de prueba mide la aproximación de la muestra a la hipótesis nula. N. Elegir la Estadística de Prueba Datos de Intervalo Prueba z es adecuada cuando: 1)El tamaño de la muestra es de cualquier orden y se conoce la desviación estándar de la población. o 2) El tamaño de la muestra es mayor que 30 y no se conoce la desviación estándar. 8 2. Se pueden cometer dos clases de errores: Error tipo I (α). El nivel de significancia (α) se escoge de acuerdo al riesgo de rechazar equivocadamente la H0 que se deseé. Datos de Intervalo (hipotesis de µ) Prueba z Prueba t Datos nominales (hipotesis de σ) Prueba ji cuadrada 7 2. Error tipo II (ß) Es no rechazar la hipótesis nula cuando ésta es realmente falsa. 2 ..Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados 2.L. Los niveles más usados son . Elegir la Estadística de Prueba Datos de Intervalo La prueba z y la prueba t.05 y . 10 3.10. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. La prueba apropiada de inferencias estadísticas varía según el nivel de ESCALA de los Datos. Nivel de Significancia (α) Es la probabilidad de rechazar la hipótesis nula cuando esta es realmente cierta .R. 9 2. Prueba t es adecuada cuando: 1) La n < 30 y no se conoce la desviación estándar. Nivel de Significancia (α) Potencia de la prueba (1-ß) Es el complemento de la probabilidad de un error tipo II. Del Paseo Residencial Monterrey. Elegir la Estadística de Prueba Datos Nominales Prueba ji cuadrada Compara una distribución hipotética de la población con una distribución generada por la muestra. (proporción) 11 3.01 12 D. son pruebas sobre el tamaño de la media de la población. Es rechazar la hipótesis nula cuando ésta es realmente cierta. La selección entre las dos depende del conocimiento que tiene el investigador sobre la desviación estándar y el tamaño de la muestra utilizado.

05.200 Determinar la distribución de probabilidad y la región critica: 18 D. Determinar la distribución de Formular la hipótesis: probabilidad y la región crítica: H0: µ ≥ 20 H1: µ < 20 Valor crítico Se obtuvo de la tabla Z . © Universidad TecMilenio Lázaro Cárdenas #2610 Col.200 H1: σ2 > . Calcular Estadístico de Prueba Parámetro en Ho una población 5. sino también que la varianza no sea mayor de . (Tablas z y t para hipótesis de medias y de ji cudrada para hipótesis de desviación) 13 14 Información Distribución Estadístico de prueba σ Normal Z n>30 Normal z n<30 Prueba t µ S* Población normal σ2 Población normal Ji cuadrada * La s es un estimado de la desviación estándar.1. Es el conjunto de valores del estadístico de prueba para los que se rechaza H0.L. Valor que define dónde comienza la región crítica. Existen fórmulas para calcular las pruebas si se tienen proporciones. 6.64 Tomar una decisión: Como cae en la región crítica rechazamos H0.200 oz2 Se seleccionó una muestra de 101 latas con un nivel de significancia de . lo cual quiere decir que el ejecutivo tiene razón.. ya que no se conoce. De la muestra se obtuvo una media de 16 y una desviación estándar de 10. Determinar Probabilidad: Valor crítico Valor crítico. Comparar valor crítico y Tomar una decisión Para tomar una decisión debemos comparar los valores críticos con el valor del estadístico de prueba. la distribución de probabilidad y el nivel de significancia.R. 17 H0: σ2 ≤ . una vez que se haya determinado dónde se encuentra la región crítica. 2006. El valor crítico se determina usando el nivel de significancia. La región crítica depende del tipo de hipótesis (una o dos colas). para el director de calidad no sólo es importante que el promedio de oz esté cerca de 12. por lo que decide escoger una muestra de 45 bolsas de papitas y probar con un nivel de significancia de . dando una media de 11. N.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados 4. 3 . Si este último cae dentro de la región crítica entonces rechazamos H0 De lo contrario decimos que no hay suficiente evidencia para rechazar H0 Ejemplo: Prueba de Hipótesis µ Sabritas quiere probar si en su nueva promoción tiene 20 ó más ganadores por día.05.64 15 16 Ejemplo: Prueba de Hipótesis µ Calcular el estadístico de prueba: Ejemplo: Prueba de Hipótesis σ2 La nueva presentación de Pepsi contiene 12 oz de refresco. Del Paseo Residencial Monterrey. se esta sobreestimando el número de ganadores por día.245oz2 Formular la hipótesis: Z -1.75 oz y σ2= . Un ejecutivo de la empresa asegura que se están sobreestimando el número de ganadores. Región crítica.

© Universidad TecMilenio Lázaro Cárdenas #2610 Col. Bibliografía • Malhotra.L. Del Paseo Residencial Monterrey. Seleccionar el estadístico de prueba en función a: a) Tipo de escala b) La información que tenemos de la muestra y desviación estándar σ para hipótesis de µ 20 Tomar una decisión: Como el valor crítico no cae en la región. Thomas. Los pasos de la prueba de hipótesis son: 1. (ISBN 970-26-0491-5). Formular la hipótesis (nula y alternativa) 2. N. Considerar los tipos de error I y II. 21 22 Créditos: Lic. Comparar Valor Crítico y tomar una decisión. Carl. 6.200 por lo tanto se acepta H0. se utilizan tablas para determinar la región crítica con valores de z. un enfoque práctico.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Ejemplo: Prueba de Hipótesis σ2 Calcular el estadístico de prueba: Análisis Inferencial Lo que hemos aprendido hasta ahora… • • • El análisis inferencial nos permite hacer supuestos de una población con los datos obtenidos de una muestra. Considerar una cola o dos colas. México: Editorial Thomson 2005. 7.. 4 . (ISBN 958600-124-5). Investigación de Mercados. Determinar la probabilidad (valor crítico). 4. no hay suficiente evidencia para decir que la varianza es mayor a . (ISBN 970-686-366-4). México: Editorial Mc Graw Hill 1996. Calcular el estadístico de prueba. Determinar el nivel de significancia α. Investigación de Mercados. 2006. 5. Naresh. Para realizar este análisis debemos aplicar la prueba de hipótesis. • Kinnear. 4.R. un enfoque aplicado. • Mc Daniel. México: Editorial Pearson Educación 2004. Ana María López Navarro 23 D. Investigación de Mercados. 19 Análisis Inferencial 3. t y jicuadrada.

es el total de sujetos que poseen la característica Bi. que la tabla de contingencia entre X e Y tendrá r filas y c columnas. La hipótesis nula del test es que las dos variables analizadas son independientes..L. Análisis bivariado: tablas cruzadas Con los datos de una muestra podemos observar si existe alguna relación entre dos variables.r) es la suma de la i-ésima fila de la tabla. es decir. 1 . Cj (j = 1. Del Paseo Residencial Monterrey. 4 • • 3 Tablas de Contingencia y Medidas de Asociación • ¿Existirá o no relación entre las variables A y B?. AM04003-Análisis e interpretación de resultados Sesión 13. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Esto es si cumple. • Ilustremos el test utilizando un ejemplo.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Tablas cruzadas o tablas de contingencia El objetivo de la tabulación cruzada es identificar la relación que existe entre dos variables.R.…. Es decir. Es decir. es decir si A y B son o no independientes. A y B serán independientes si cada entrada de la tabla es igual al producto de los totales marginales dividido entre el número de datos. n representa el total de observaciones tomadas. Es decir. Las tablas de contingencia son tabulaciones cruzadas entre dos variables X e Y con r y c categorías respectivamente. La hipótesis alternativa es que las variables no son independientes. N.c) es la suma de la j-ésima columna de la tabla. y la pregunta que surge naturalmente es si esta relación es verdadera o es el resultado del error muestral. llamada Tabla de contingencia.…. que tienen las • Ri (i = 1. 6 Oij = Ri C j n 5 D. es el total de sujetos que poseen la característica Ai. cuya forma general es la siguiente: VAR B1 VAR A A1 A2 A3 … Ar Total Or1 C1 Or2 C2 Or3 C3 … … O11 O21 O31 B2 O12 O22 O32 B3 O13 O23 O33 B … Bc O1c O2c O3c … Orc Cc Rr n Total R1 R2 R3 Tablas cruzadas o tablas de contingencia • Oij es el número de sujetos características Ai y Bj a la vez. que existe una relación entre las dos variables. 2006. La siguiente tabla de contingencia muestra la tabulación cruzada de la variable ingreso anual (dividido en tres categorías) y la última marca de coche comprada (dividida en tres marcas). • Se utiliza un test de hipótesis conocido como el test Chicuadrado de Pearson. 1 2 Los datos se organizan en una tabla de doble entrada.

000 más de 40.L. 2 . Una vez hecho esto el estadístico Chi-cuadrado se calcula con la siguiente fórmula: E ij i =1 j =1 r = número de categorías de la variable en las filas c = número de categorías de la variable en las columnas Oij = número observado en entrada ij Eij = número esperado en la entrada ij • Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de libertad. • El test Chi-cuadrado de Pearson se basa en encontrar cuál hubiera sido el valor de cada entrada si las variables fueran independientes.000 20.091 El número esperado en la entrada A1B1 es entonces: N* Pr(A1 y B1) = 1200*0. – Eij = número esperado – NAi= número de elementos en la categoría Ai – NBi= número de elementos en la categoría Bi Para A1B1 el número esperado es: – E11 = (375*350)/1200 = 109. Del Paseo Residencial Monterrey. 12 χ2 = ∑ ∑ r c (Oij − E ij )2 D. Por lo tanto: Pr(A1 y B1) = Pr(A1)*Pr(B1) = 375*350/(1200*1200) = 0. Por ejemplo. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. 2006.000 $ compraron un auto marca Ford.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Tablas de Contingencia y Medidas de Asociación Marca del último auto comprado Ford Toyota Renault Ingreso anual Menos de 20.38 9 10 Tablas de Contingencia y Medidas de Asociación En general la fórmula del valor esperado es: Eij = (NAi*NBj)/N.R.. la probabilidad del evento conjunto "A1: ganar menos de $20. 50 personas que ganan menos de 20. Es decir. N. Pr(B1) = B1/B = 350/1200 Donde A y B son las frecuencias totales de los eventos.38 11 • Este proceso se puede repetir para cada una de las entradas de la tabla. Total 7 8 • Si ingreso y marca son independientes.091 = 109.000" y "B1: comprar marca Ford" es el producto de esas dos probabilidades: Pr(A1 y B1) = Pr(A1)*Pr(B1) Pr(A1) = A1/A = 375/1200.000 .000 Total 50 200 100 350 200 100 25 325 125 350 50 525 375 650 175 1200 Tablas de Contingencia y Medidas de Asociación • Las entradas de la tabla representan el número de personas en la muestra con cada combinación de ingreso y marca de auto. el valor esperado de cada celda de la tabla si las variables ingreso y marca son independientes.40.

• Como 252. Del Paseo Residencial Monterrey. Es decir.. Valores próximos a cero indican poca asociación entre las variables y valores cercanos a uno indican una fuerte asociación. donde si r y c son el número de categorías de cada una de las variables: Cmax = [min(r-1.L.2.49. El estadístico de Pearson nos dice si dos variables son independientes una de otra pero no nos dice nada acerca de la naturaleza de la relación. 2006. su valor será próximo a uno. • Este coeficiente toma valores en el intervalo cero-uno. N. si las variables son independientes.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Tablas de Contingencia y Medidas de Asociación • En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad. • El coeficiente φ puede ser calculado como el coeficiente de correlación entre dos variables dicotómicas.c-1))]1/2 17 18 D. • Comparando este número con el valor crítico de la distribución Chi-cuadrado con 4 grados de libertad a un nivel de significatividad del 5% el valor crítico correspondiente es 9. las variables no son independientes. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. el estadístico da 252. 1) el estadístico de Pearson puede ser poco preciso.c-1)/(1+ min(r-1. 15 16 Riesgo Relativo • El riesgo relativo es una medida del grado de asociación entre dos variables dicotómicas. 13 14 Medidas de Asociación para Tablas de 2x2 El Coeficiente Phi (φ) • Es una medida del grado de asociación entre dos variables dicotómicas basada en el estadístico Chicuadrado de Pearson. Realizando todas las cuentas con la tabla del ejemplo. En esos casos se suelen utilizar otras medidas de asociación.49 se rechaza la hipótesis nula. puede ser calculado utilizando el estadístico Chi-cuadrado de Pearson con la siguiente fórmula: φ = (χ2/N)1/2 donde N es el número de datos. Toma valores entre 0 y Cmax. El coeficiente de contingencia • El coeficiente de contingencia es una extensión del coeficiente φ al caso de que al menos una de las variables presente más de dos categorías. 3 .R.2 > 9. Alternativamente. En consecuencia toma valores positivos y. que compara el producto de las frecuencias en la diagonal principal de la tabla con el producto de las frecuencias en la diagonal opuesta mediante el cociente entre ambos. Cuando analizamos variables dicotómicas (adoptan solo los valores 0.

un enfoque aplicado. a diferencia del coeficiente de contingencia toma valores entre 0 y 1. Carl.. Ana María López Navarro 21 22 D. 4 . (ISBN 970-26-0491-5). México: Editorial Thomson 2005.R.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Medidas de Asociación para Tablas Mayores a 2x2 Valores del coeficiente de Contingencia cercanos a 0 indican que no hay asociación entre las variables y valores próximos a Cmax indican una fuerte asociación (note que Cmax es un número que siempre será menor a uno). (ISBN 970-686-366-4). Investigación de Mercados. V = (χ2/(r ó c)*N)1/2 19 20 Bibliografía • Malhotra. • Kinnear. • Mc Daniel. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Investigación de Mercados. Naresh. México: Editorial Pearson Educación 2004. Créditos: Lic. Del Paseo Residencial Monterrey.L. Thomas. (ISBN 958-600-124-5). Medidas de Asociación para Tablas Mayores a 2x2 La V de Cramer Otra extensión del coeficiente φ al caso de variables con más de dos categorías es la V de Cramer que. México: Editorial Mc Graw Hill 1996. Valores de V cercanos a 0 indican que no hay asociación entre las variables y valores cercanos a 1 indican una fuerte asociación. N. un enfoque práctico. Investigación de Mercados. 2006.

Y = Variable dependiente o variable respuesta. 2. dep.j = fij Si son independientes ya no seguimos estudiando la relación porque no existe. en variables dependientes como ventas o participación de mercado de un producto. Se conocen como técnicas bivariadas.) (estimar los valores de la vble. 2006. variables independientes tales como precio.Coeficiente de asociación (H) 2.otros estadísticos (“ro de Spearman... no se sigue estudiando.L. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Análisis bivariado Son los métodos estadísticos para analizar la relación entre dos variables de estudio. Si existe dependencia.. N.Test de la X2 (Lo veremos al ver la inferencia) Correlación 1. Por ejemplo. distribución. Del Paseo Residencial Monterrey. etc. nos plantearemos el grado de dependencia. que es el criterio. se pueden utilizar para describir el tipo de relación y predecir su comportamiento.-Analíticamente: Covarianza. Análisis bivariado: correlación 1 2 Procedimientos bivariados Las variables independientes son aquellas que se cree afectan el valor de la variable dependiente. gasto en promoción. que es el factor de predicción.. 5 Correlación y regresión VARIABLES CUALITATIVAS VARIABLES CUANTITATIVAS Estudio de independencia “Dos variables son independientes cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales” fi.Estudio del grado de relación Grado de asociación 1. * f. REGRESIÓN: Con esta técnica trataremos de determinar el tipo de dependencia. X = Variable independiente o regresora.. debe de existir una variable independiente. Relación no lineal (no la veremos) 6 D. Dos variables de intervalo ¿Cuál es el nivel de escala de las variables? Dos variables ordinales Dos variables nominales • Coeficiente de correlacional lineal r • Regresión simple • Coeficiente de correlación por rangos • Gamma • Tao • Coeficiente de contingencia • Lambda Prueba t sobre el coeficiente de regresión Prueba z sobre la diferencia entre medias Prueba t sobre la diferencia entre medias Prueba U de Mann Whitney Prueba de Kolmogorov Smirnov Prueba de ji cuadrado 3 4 Análisis bivariado CORRELACIÓN: Con esta técnica trataremos de dar respuesta a si existe dependencia entre dos variables. Coeficiente de correlación de Pearson. Si son independientes. AM04003-Análisis e interpretación de resultados Sesión 14. 3. Si son dependientes intentaremos determinar la variable dependiente a partir de la variable independiente.. 2. y una variable independiente. Cuando se analiza el grado de asociación entre dos variables. 1 . a Relación lineal.R. “tau” de kendall) 3. Regresión partir de la ind.Gráficamente.

Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Introducción: un poco de historia El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889) refiriéndose a la “ley de la regresión universal”: – “Cada peculiaridad en un hombre es compartida por sus descendientes. Altura en cm. de qué tipo.5 altura del padre (aprox.. Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.. Mide 161 cm.. Peso en Kg. au eso el p que ce are ura P lt la a on ac ent m 150 160 170 180 190 200 12 D. en un grado menor.. Mide 187 cm. pero en media.) • Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura. Peso en Kg. 61 60 78 62 66 60 54 84 68 . – Los individuos no se muestran en ningún orden particular.. y si es posible predecir el valor de una de ellas en función de la otra. N. Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables. En ellos... 61 60 78 62 66 60 54 84 68 . 7 8 Correlación A la derecha tenemos un ejemplo de los datos obtenidos observando dos variables en varios individuos de una muestra.. Lo mismo puede decirse de los padres muy bajos. 2006. 100 90 80 70 60 50 40 30 140 150 160 170 180 190 200 11 Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión. Del Paseo Residencial Monterrey. aunque tienen tendencia a acercarse (regresar) a la media. ANÁLISIS GRÁFICO: Dichas observaciones pueden ser representadas en un diagrama de dispersión (‘scatterplot’). – Pearson (un amigo suyo) realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo: • Altura del hijo = 85cm + 0. – Cada columna representa los valores que toma una variable sobre los mismos. cada individuos es un punto cuyas coordenadas son los valores de las variables. 9 10 Correlación . Altura en cm. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.Diagramas de dispersión Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión. 100 90 Pesa 76 kg. – En cada fila tenemos los datos de un individuo. 162 154 180 158 171 169 166 176 163 .L. 2 . 162 154 180 158 171 169 166 176 163 ..R.” • Regresión a la media – Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable). 80 70 60 50 40 30 140 Pesa 50 kg.

si p=or<... 10 kg. pero no servirá para otro tipo de relaciones (cuadrática. – Directa: Sxy >0 1 – Inversa: Sxy <0 S xy = ( xi − x )( yi − y ) n i – No-relacionda: Sxy =0 Correlación: Covarianza de dos variables X y Y La covarianza tiene el inconveniente de que no está delimitada. significa que sí existe una relación significativa y procedemos a determinar: r= S xy SxS y 17 18 D. Para los valores de X mayores que la media le corresponden valores de Y menores. 170 180 190 200 13 Cierta relación inversa 20 10 0 140 150 160 170 180 190 200 14 Correlación: Covarianza de dos variables X y Y • La covarianza entre dos variables.05. •Para los valores de X menores que la media le corresponden valores de Y menores también.. 80 70 60 50 40 30 10 cm. Sxy.L. Esto es relación inversa o decreciente. ya que si la relación es (>. siginifica que no existe relación. a la hora de calcular el coeficiente. por lo que permite comparar entre distribuciones. r.. Debemos identificar tres aspectos : 1. N. pero no nos dice nada sobre el grado de relación entre las variables. 330 280 230 180 130 80 30 140 100 Incorrelación 90 80 70 60 50 40 30 Fuerte relación directa. logarítmica. • Además es una medida que depende de las unidades. 100 90 80 70 60 50 40 30 140 150 160 Correlación: Cómo reconocer relación directa e inversa. 3 . Del Paseo Residencial Monterrey. 150 160 170 180 190 200 140 150 160 170 180 190 200 Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. o sea.) Correlación: Coeficiente de correlación lineal de Pearson El coeficiente nos sirve para determinar si existe una relación significativa o no a la asociación en análisis. •Esto se llama relación directa o creciente entre X e Y.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Correlación: Predicción de una variable en función de la otra = Regresión Aparentemente el peso aumenta 10 kg por cada 10 cm de altura. debe ser examinado primero. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Incorrelación.. •Para los valores de X mayores que la media le corresponden valores de Y mayores también.. – s útil para determinar si hay relación lineal entre dos variables. nos indica si la posible relación entre dos variables es directa o inversa.05). Tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa. 2006. nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). 15 16 Correlación: Coeficiente de correlación lineal de Pearson La coeficiente de correlación lineal de Pearson de dos variables. el peso aumenta en una unidad por cada unidad de altura.R. por tanto necesitamos un coeficiente o algún valor que venga definida la relación entre dos variables para poder saber si la relación es fuerte o débil: COEFICIENTE DE CORRELACIÓN DE PEARSON ∑ • El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no. Grado de presencia : El valor de p.

L. 2006. Entre más cercano sea a 1.21 y +. Ana María López Navarro 23 D. México: Editorial Mc Graw Hill 1996.41 +. México: Editorial Thomson 2005. disponemos de dos estadísticos: – ρ (‘ro’) de Spearman – τ (‘tau’) de Kendall Son estadísticos análogos a r y los podemos aplicar donde las variables no puedan considerarse numéricas.40 ó -. México: Editorial Pearson Educación 2004. (ISBN 970-26-0491-5). Dirección de la asociación: Hay que ver si el coeficiente es negativo (-) o positivo (+).80 y +.60 y +. Fuerza de la asociación: El coeficiente de correlación (r) es un número que se encuentra en el rango –1. Investigación de Mercados.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Correlación: Coeficiente de correlación lineal de Pearson 2. • Kinnear. Si el coeficiente cae entre: +1 y +. a continuación presentamos una clasificación que será útil en este aspecto. Correlación: Coeficiente de correlación lineal de Pearson Después de haber obtenido el coeficiente de correlación y determinar si es estadísticamente significativo. (ISBN 970-686-366-4).0.. podemos concluir acerca de la fuerza en la asociación de variables. • Mc Daniel.21 y -.40 Igual o menor a ±.81 ó -1 y -.R. un enfoque práctico.00 (+ ó -). N.20 Relación Alta Relación Moderada Relación Baja Relación Débil Inexistente 20 19 Correlación: Otros coeficientes de correlación Cuando las variables en vez de ser numéricas son ordinales. Carl. Investigación de Mercados.80 y -.41 ó -.60 y -. Investigación de Mercados. Del Paseo Residencial Monterrey.61 +. Bibliografía • Malhotra. 21 22 Créditos: Lic. mayor es la asociación.81 +. 3. Naresh. es posible preguntarse si hay algún tipo de correlación entre ellas.61 ó -. Para estos casos.0 a +1. un enfoque aplicado. (ISBN 958-600-124-5). Thomas. 4 . © Universidad TecMilenio Lázaro Cárdenas #2610 Col.

Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados

Regresión
El análisis de regresión no se debe confundir con el de correlación, el que mide el grado de relación lineal entre las variables, en cambio, el de regresión, mide relaciones de causalidad. El análisis de correlación supone que todas las variables son aleatorias, en cambio, cuando se regresiona, se supone que las variables explicativas son fijas en muestreos repetidos.

AM04003-Análisis e interpretación de resultados
Sesión 15. Análisis bivariado: regresión lineal simple

1

2

El análisis de regresión sirve para predecir una medida en función de otra medida (o varias). Y = Variable dependiente – predicha – explicada X = Variable independiente – predictora – explicativa ¿Es posible descubrir una relación? – Y = f(X) + error • f es una función de un tipo determinado • el error es aleatorio, pequeño, y no depende de X

Veremos un ejemplo del estudio de la altura en grupos familiares de Pearson, como la sesión anterior, que estaremos manejando durante el resto del tema. – Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X) • Si el padre mide 200cm ¿cuánto mide el hijo? – Se espera (predice) 85 + 0,5x200=185 cm. » Alto, pero no tanto como el padre. Regresa a la media.

3

4

Modelo de regresión lineal simple
• En el modelo de regresión lineal simple, dado dos variables –Y (dependiente) –X (independiente, explicativa) •buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante –Ŷ = b0 + b1X •b0 (ordenada en el origen, constante) •b1 (pendiente de la recta) •Y y Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad – e=Y-Ŷ se le denomina residuo o error residual.

• Si el padre mide 120cm ¿cuánto mide el hijo? – Se espera (predice) 85 + 0,5x120=145 cm. » Bajo, pero no tanto como el padre. Regresa a la media. Es decir, nos interesaremos por modelos de regresión lineal simple.

5

6

D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

1

Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados

Modelo de regresión lineal simple
•Y y Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad – e=Y-Ŷ se le denomina residuo o error residual. En el ejemplo de Pearson y las alturas, él encontró: – Ŷ = b0 + b1X • b0=85 cm (No interpretar como altura de un hijo cuyo padre mide 0 cm) • b1=0,5 (En media el hijo gana 0,5 cm por cada cm del padre)
180 150 120 90 60 30 0
7 8
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220

b1=0,5

b0=85 cm

La relación entre las variables no es exacta. Es natural preguntarse entonces: Cuál es la mejor recta que sirve para predecir los valores de Y en función de los de X Qué error cometemos con dicha aproximación (residual).

Modelo de regresión lineal simple
El modelo lineal de regresión se construye utilizando la técnica de estimación mínimo cuadrática: – Buscar b0, b1 de tal manera que se minimice la cantidad • Σi ei2 Se comprueba que para lograr dicho resultado basta con elegir: S b1 = r Y b0 = y − b1 x SX

180 150 120 90 60 30 0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220

b1=0,5

b0=85 cm
9 10

Se obtiene además unas ventajas “de regalo” – El error residual medio es nulo. – La varianza del error residual es mínima para dicha estimación. • Traducido: En término medio no nos equivocamos. Cualquier otra estimación que no cometa error en término medio, si es de tipo lineal, será peor por presentar mayor variabilidad con respecto al error medio (que es cero).

Modelo de regresión lineal simple
• Que el error medio de las predicciones sea nulo no quiere decir que las predicciones sean buenas. • Hay que encontrar un medio de expresar la bondad del ajuste (bondad de la predicción)
No importa. Con los dos últimos clientes me equivoqué en +10 y +20. En término medio el error es cero. Cometió un error de -30 en su última predicción

11

12

D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

2

Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados

¿Cómo medir la bondad de una regresión?
Imaginemos un diagrama de dispersión, y vamos a tratar de comprender en primer lugar, qué es el error residual, su relación con la varianza de Y, y de ahí, cómo medir la bondad de un ajuste.
13

¿Cómo medir la bondad de una regresión? Interpretación de la variabilidad en Y
En primer lugar olvidemos que existe la variable X. Veamos cuál es la variabilidad en el eje Y. La franja sombreada indica la zona donde varían los valores de Y. Proyección sobre el eje Y = olvidar X
Y

14

¿Cómo medir la bondad de una regresión?

Interpretación del residuo
Y

Regresión: Bondad de un ajuste
Resumiendo: • La dispersión del error residual será una fracción de la dispersión original de Y • Cuanto menor sea la dispersión del error residual mejor será el ajuste de regresión. Eso hace que definamos como medida de bondad de un ajuste de regresión, o coeficiente de determinación a:
Y

Fijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y. Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original. Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.

R2 = 1−
15

S e2 2 SY

2 Se2 < SY
16

Regresión: Bondad de un ajuste Resumen
•La bondad de un ajuste de un modelo de regresión se mide usando el coeficiente de determinación R2 •R2 es una cantidad adimensional que sólo puede tomar valores en [0, 1] •Cuando un ajuste es bueno, R2 será cercano a uno. •Cuando un ajuste es malo R2 será cercano a cero. •A R2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión. •R2 puede ser pesado de calcular en modelos de regresión general, pero en el modelo lineal simple, la expresión es de lo más sencilla: R2=r2

17

18

D.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

3

• Kinnear.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Bibliografía • Malhotra. Investigación de Mercados. • Mc Daniel. Del Paseo Residencial Monterrey. (ISBN 970-686-366-4). México: Editorial Mc Graw Hill 1996. (ISBN 958-600-124-5). México: Editorial Thomson 2005. Ana María López Navarro 19 20 D.R. Investigación de Mercados. 2006. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. un enfoque práctico.. Thomas. un enfoque aplicado. Créditos: Lic. 4 . México: Editorial Pearson Educación 2004.L. Investigación de Mercados. (ISBN 970-26-0491-5). Carl. Naresh. N.

Cadena. 3 Introducir datos en SPSS Al abrir el programa SPSS lo primero se solicita es el archivo de trabajo. sin embargo. N.). Minitab e inclusive Excel que se pueden utilizar. el Tipo (Numérico. SPSS 1 2 Regresión SPSS esta estructurado en tres ventanas diferentes: Editor de datos de SPSS: es la primera ventana que aparece nada más acceder al programa. El programa SPSS trabaja con los datos previamente grabados en un archivo al que denominamos archivo de datos y tiene la extensión obligatoria . Se puede seleccionar una base de datos o bien pulsar en el botón Cancelar y acceder directamente a la ventana de Editor de datos del programa SPSS.sav 4 La ventana de Editor de datos de SPSS dispone de dos pestañas: Vista de datos y Vista de variables.Universidad Tec Milenio: Profesional AM04003– Analisis e interpretación de resultados SPSS El paquete estadístico SPSS (Statistical Package for the Social Sciences) es uno de los muchos que se pueden utilizar para la investigación de mercados. Permite visualizar los datos y las variables con los que vamos a trabajar. al implementar cualquiera de las utilidades que nos ofrece SPSS.. implementar un método. dibujar un gráfico. están numeradas de forma correlativa. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.L.Vista de variables: recoge las características de las variables o lo que es lo mismo. de las columnas. En esta ventana se pueden entrar de forma manual los datos o bien cargar unos nuevos datos mediante la opción Abrir Datos del menú Archivo. etiquetas para Valores de la variable. AM04003-Análisis e interpretación de resultados Sesión 16. Informa sobre el Nombre de la variable. Las filas. el SPSS es el más empleado actualmente para este rubro. Cada columna tiene asignado un nombre de variable. Recoge todos los menús para trabajar con los datos y realizar los análisis estadísticos.Vista de datos: está dividida en columnas y filas dando lugar a celdas o casillas donde se recogen los datos. ya sea especificado por el usuario o bien por el propio programa SPSS (máximo 8 caracteres). 2006... Visor de resultados de SPSS: en esta ventana podemos visualizar los resultados del método implementado.R. Existen otros paquetes como SAS. 5 6 D. la Alineación y la Medida. Fecha. 1 . el Ancho de la variable. en general. . Del Paseo Residencial Monterrey. . el número de decimales (en el caso de variables numéricas). el ancho de columna. etiquetas para identificar valores Perdidos. la Etiqueta (permite introducir una pequeña descripción de la variable). a su vez. Editor de sintaxis de SPSS: en esta ventana podemos pegar la sintaxis generada al realizar un cálculo.

que éstos serían las NO-respuestas por parte de los entrevistados. Hay que definir los valores perdidos. peso y altura. pueden ser de hasta 60 caracteres. Para cada variable habrá que ir especificando cada una de sus características.. deseamos ver qué ocurre si seleccionamos las variables edad y sexo. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. nos aparece una ventana en la que hemos de seleccionar las variables sobre las que deseamos obtener la información. empezando por el nombre (primera columna). Veamos la salida que nos proporciona el procedimiento frecuencias. 4. usualmente se asigna 99. se escribe un código en la zona en la que aparece “Valor” y la etiqueta correspondiente en la zona de “Etiqueta de valor” y después pulsar el botón de Añadir. Del Paseo Residencial Monterrey. generalmente se le asigna un número grande y fácil de tabular a fin de que no se confunda con los valores de análisis. al código 2 se la ha asignado la etiqueta “moderado” y al código 3 se le añadirá la etiqueta “grave” en cuanto pulsemos el botón Añadir. para cada variable seleccionada: 11 12 D. al ejecutar este procedimiento. 2006. No olvides grabar tu documento para no perder la información almacenada. en la Figura 3. Es un buen procedimiento para una inspección inicial de los datos. Supongamos que deseamos estudiar una muestra de 50 sujetos a los que hemos medido cinco variables: edad. sexo.Universidad Tec Milenio: Profesional AM04003– Analisis e interpretación de resultados Creación de un archivo 1. 8 Vista de archivo Un archivo de datos tendría mas o menos el siguiente aspecto: Estadísticas Descriptivas El procedimiento Frecuencias proporciona estadísticos y representaciones gráficas que resultan útiles para describir muchos tipos de variables. N. 7 3.R. 2 . Estadísticas Descriptivas Si pulsamos aceptar sin modificar ninguna otra opción. la salida que proporciona el programa es la siguiente. Debemos crear la estructura (definir las variables) de un nuevo archivo de datos de SPSS. Definir etiquetas para cada variable. 2. Supongamos que en nuestro caso. así. al código 1 se le ha asignado la etiqueta “no”.2. 9 10 En primer lugar.L.

. Del Paseo Residencial Monterrey. 3 . estadísticos de posición. 17 18 D. la salida que proporciona el programa es la siguiente: Además de los estadísticos que aparecen en el cuadro anterior es posible añadirles otros. mediana.R. la salida sería: 15 16 Estadísticas Descriptivas Si se ejecuta el procedimiento para el conjunto de variables seleccionadas. de dispersión o sobre la forma de la distribución). desviación típica y varianza y lo ejecutamos para la variable edad. media. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.Universidad Tec Milenio: Profesional AM04003– Analisis e interpretación de resultados Además. Si seleccionamos la opción Histogramas. Si seleccionamos esa opción aparecerá la siguiente ventana: El procedimiento Descriptivos muestra estadísticos de resumen univariados para variables en una única tabla y calcula puntuaciones tipificadas (puntuaciones z). por ejemplo. en el procedimiento frecuencias podemos establecer una serie de opciones. Simplemente en el cuadro de Descriptivos hay que pulsar sobre el botón Opciones y aparecerá la siguiente ventana: En ella se pueden seleccionar más estadísticos y elegir el orden de visualización de las variables (alfabético o por el valor ascendente o descendente de las medias). serían: 13 14 Igualmente. N. podemos elegir un conjunto de ellos sobre las variables seleccionadas (valores percentiles. además del cuadro referente a las frecuencias. Si en la ventana de Frecuencias elegimos el botón de Estadísticos. por ejemplo. en el procedimiento Frecuencias existe una opción para dibujar gráficos. 2006.L. Si en ese cuadro seleccionamos. los resultados proporcionados.

© Universidad TecMilenio Lázaro Cárdenas #2610 Col. 21 22 Además. N. Esta opción proporciona distintos estadísticos que hemos de seleccionar en función del tipo de variables con las que estamos trabajando (dicotómicas.L. la opción Formato permite. Los estadísticos de tablas de contingencia y las medidas de asociación sólo se calculan para las tablas de doble clasificación. 2006. el procedimiento tablas de contingencia crea un panel de medidas y estadísticos asociados para cada valor del factor capa. el procedimiento permite acceder a la ventana Casillas. Así permite mostrar las frecuencias esperadas y tres tipos de residuos que miden la diferencia entre las frecuencias observadas y las esperadas.).R.. Veamos la salida que proporciona: El procedimiento Tablas de contingencia tiene tres posibilidades. una columna y un factor de capa (variable de control). La primera opción es Estadísticos. elegir las filas en orden ascendente o descendente. 19 20 En nuestro ejemplo vamos a realizar una tabla de contingencia para las variables edad en filas y sexo en columnas. nominales. Como siempre para acceder a ellas debemos pulsar los botones de la parte inferior de la ventana de Tablas de contingencia. Si se especifica una fila.Universidad Tec Milenio: Profesional AM04003– Analisis e interpretación de resultados Tablas Cruzadas El procedimiento Tablas de contingencia crea tablas de clasificación doble y múltiple y además proporciona 22 pruebas y medidas de asociación para tablas de doble clasificación. Esta ventana permite descubrir las tramas en los datos que contribuyen a una prueba chi-cuadrado significativa. 4 . porcentajes y residuos seleccionados. ordinales. como en otros procedimientos del programa. 23 24 D. etc. Por último. Del Paseo Residencial Monterrey. Cada casilla de la tabla puede contener cualquier combinación de recuentos.

Para llevar a cabo una Regresión Lineal. un enfoque práctico.L. México: Editorial Mc Graw Hill 1996. • Mc Daniel.Universidad Tec Milenio: Profesional AM04003– Analisis e interpretación de resultados Regresión y Correlación En todo problema de regresión y correlación. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Naresh. se realiza con el procedimiento Analizar Correlaciones Bivariadas 25 26 Análisis de Varianza Para llevar a cabo un Análisis de Varianza. • Kinnear. se realiza con el procedimiento Analizar Comparar Medias ANOVA de un factor Bibliografía • Malhotra. 27 28 Créditos: Lic. N. Investigación de Mercados. un enfoque aplicado.R. 5 . lo encuentras en Gráficos Diagrama de Dispersión. (ISBN 958600-124-5). (ISBN 970-686-366-4). México: Editorial Pearson Educación 2004. El procedimiento que permite dibujar nubes de puntos. el primer paso consiste en dibujar la nube de puntos. Del Paseo Residencial Monterrey. Thomas. se realiza con el procedimiento Analizar Regresión Linea Para llevar a cabo una Correlación. Carl. Investigación de Mercados. con objeto de detectar posibles no-linealidades en la relación o alguna otra falla en las hipótesis del modelo de regresión lineal. (ISBN 970-26-0491-5). México: Editorial Thomson 2005. Ana María López Navarro 29 D.. 2006. Investigación de Mercados.

L. Del Paseo Residencial Monterrey. se utiliza para analizar resultados experimentales. regulares y ocasionales. • Estadística F. También se denota SCx. como consumo constante. Una combinación particular de niveles de factores se llama tratamiento. Variación total de Y. Las variables independientes deben ser variables nométricas. Por ejemplo. • SCE. Es la variación de Y debido a la variación en cad una de las categorías de X. que en este caso sería la preferencia por la avena. ¿Cómo varía la intención de compra del producto por parte de los consumidores según los niveles de precios? ¿Varían las opiniones de las políticas de distribución de la empresa entre los agentes. N. regular u ocasional. 1 2 AM04003-Análisis e interpretación de resultados Sesión 17. 2006. 1 . • SCA.. La fuerza de los efectos X en Y. difieren en su preferencia a la avena Quaker. Generalmente la hipótesis nula es que todas las medias son iguales. Análisis bivariado: varianza (ANOVA) El ANOVA puede responder a preguntas cómo: El análisis de varianza debe tener una variable dependiente.R. Es la variación de Y relacionada con la variación de las categorías de X. El valor de η2 varía entre 0 y 1.Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados Análisis de Varianza El análisis de varianza (ANOVA) prueba medias de dos o más poblaciones. Con esta estadística se verifica la hipótesis nula de que las medias de las categorías son iguales. A las variables independientes se les llama factores. • SCy. medido en una escala Likert de nueve puntos. supongamos que un investigador quiere saber si los consumidores constantes. La hipótesis nula de que no difiere la preferencia por la avena de los cuatro grupos puede verificarse con un análisis de varianza. 5 Etapas del ANOVA de un factor Identificar variables dependiente e independiente Descomponer la variación total Medir los efectos Probar la significación Interpretar resultados 6 D. más los no-consumidores de la avena en sobres de sabores Quaker. Se denota con Scerror. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. que es métrica (medida en una escala de intervalo o razón). vendedores y mayoristas? ¿Varía el nivel de consumo de mi producto según el segmento? 3 4 Análisis de Varianza Estadísticos principales • Eta2 (η2).

Fisher que durante los años 1912 a 1962 y contribuyó en forma notable a un modo de pensamiento y filosofía estadística moderna. pero es muy largo y complicado. Del Paseo Residencial Monterrey. y si se tienen gran cantidad de datos tiene que recurrirse a algún tipo de software.98832753 F 8. En la práctica todo se resume en un estadístico.000 4.L. si tenemos 3 programas distintos de incentivos y queremos ver cuál aumenta el rendimiento de manera más eficaz. utilizamos el análisis de varianza.95331 Grados de libertad 4 Medias cuadráticas 0. Sumas de cuadrados Entre grupos Dentro de los grupos 3.119761824 Total 8.. El formato general de una tabla de ANOVA que arrojan los paquetes estadísticos generalmente tiene los siguientes componentes: Fuente de Variación Tratamientos Tabla de Anova Suma de Grados de Cuadrado Cuadrados libertad Medio SSCA k-1 MSTR= SSCA/ k-1 F F= MSTR/MSE Error SCE nT . En caso contrario. N.k Total SSy nT-1 7 Donde: k=número de tratamientos.k MSE= SCE/nT . F. nT= Número total de datos 8 Estadístico F • Este tipo de análisis fue ideado por Sir Ronald A. .431188 37 0.05. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados Etapas del ANOVA de un factor Todo el proceso se puede hacer en forma manual. no podemos rechazar la hipótesis de igualdad y no podremos afirmar que los grupos comparados difieran en sus promedios poblacionales. Queremos medir el rendimiento de cada grupo y averiguar si existen o no diferencias entre ellos.R. y tiene desglosados todos los componentes del mismo.05 rechazaremos la hipótesis de igualdad de medias y concluiremos que no todas la medias poblacionales comparadas son iguales. Fórmula: Por ejemplo.384498 41 En una tabla este es el valor que se evalúa y se compara en base a . 2 . 11 12 D. F= SCx / ( c – 1 ) Scerror / ( N – c) ) 9 10 Estadístico F Si la probabilidad o significancia del Estadístico F es menor a . 2006.252442 Sig.

Ana María López Navarro 15 D. puesto que la significancia da a . 3 . por lo cual se rechaza la hipótesis nula y podemos concluir que sí existe una diferencia en rendimiento de acuerdo al programa de incentivos utilizado.. Naresh. 2006. México: Editorial Pearson Educación 2004. (ISBN 970-686-366-4). entonces vemos que . Carl. Bibliografía • Malhotra.L.000. Investigación de Mercados. • Mc Daniel. N.R. 13 14 Créditos: Lic. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. un enfoque práctico.000.05 es mayor que . Investigación de Mercados. México: Editorial Thomson 2005.Universidad Tec Milenio: Profesional AM04003– Análisis e interpretación de resultados Estadístico F En este caso. (ISBN 970-26-0491-5). Del Paseo Residencial Monterrey.

N. b1 y b2 son los coeficientes de regresión generados a partir de datos de la muestra.R. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. AM04003-Análisis e interpretación de resultados Sesión 18. 1 .Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Análisis multivarainte Es el análisis simultáneo de más de dos variables. La ecuación predictiva : Y= a + b1X1 +b2X2 Las variables independientes se utilizan para predecir la dependiente Múltiples variables dependientes Correlación Canónica X1 y X2 a. 2006. Análisis multivariante.L.. que indica la contribución relativa de dicha variable para explicar la dependiente 5 6 D. Del Paseo Residencial Monterrey. Técnicas dependientes Se pueden categorizar en función a: • Si alguna de las variables se puede identificar como dependiente de otra u otras • Existe más de una variable dependiente • La naturaleza de los datos (tipo de escala) 1 2 Propósitos del análisis multivariante • • • • • • • • • Comprender la relación de los datos (mediante las distancias de éstos) Visualizarlos Hacer modelos Obtener información correlacionada Reducir los datos o simplificar la estructura de éstos Sortearlos y agruparlos Investigar la dependencia entre las variables Predecir Construir hipótesis y probarlas 3 Análisis multivariante Técnicas Multivariantes Técnicas de Dependencia Una Variable Dependiente Técnicas de Interdependencia Interdependencia variables Semejanza entre objetos Mas de una variable dependiente Regresión Múltiple Correlación Discriminante Canónica Medición Conjunta Varianza y Covarianza Análisis Conglomerado Factor Común Escala Multidimensional 4 Técnicas dependientes Una variable dependiente Regresión Múltiple Análisis Discriminante Varianza y Covarianza Medición Conjunta Regresión múltiple Examina la relación entre por lo menos 2 variables independientes de intervalos de escala y una variable dependiente de intervalo de escala.

Análisis discriminante Objetivos: 1) Analizar si existen diferencias entre los grupos en cuanto a su comportamiento con respecto a las variables consideradas y averiguar en qué sentido se dan dichas diferencias (descriptivo). Considera la siguiente ecuación de regresión múltiple: Y = 121 + 0. Precios Competitivos. Combinación lineal de las variables independientes que diferencie al máximo los puntajes de las medidas a través de categorías de la variable dependiente.. Para ello realiza una encuesta a una muestra de 200 de ellos en las que le pide que valoren su labor haciendo una valoración entre 0 y 5 en los siguientes aspectos: Limpieza. Del Paseo Residencial Monterrey.42 donde: Y = Estimado de ventas. a partir de grupos ya determinados Se utiliza con una variable dependiente en escala nominal y un conjunto de variables independientes en escala de intervalo. 2) Elaborar procedimientos de clasificación sistemática de individuos de origen desconocido. Servicio en Caja. Calidad. tiene clasificados a sus clientes en dos grupos de acuerdo a si tienen hijos o no. indica la proporción de la variación en Y explicado por la regresión. 42% de la variación en Ventas pueden ser relacionadas por el costo de publicidad y el ingreso.2 unidades por cada unidad incrementada en el costo de publicidad y en 5. 2 . N. asumiendo que todas las demás variables independientes permanezcan constantes.2 X2 R2 = 0.2 unidades por cada incremento en los ingresos R2 es el coeficiente de determinación múltiple. 2006. El tamaño del coeficiente indica la cantidad de cambio en la variable dependiente asociado con un incremento de una unidad en dicha variable independiente. X2 = Ingresos Las ventas tienden a aumentar en .L.R. en uno de los grupos analizados. un coeficiente negativo indica una relación inversa. 11 12 D. Disponibilidad de Productos.2 X1 + 5. Cercanía y Promociones.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Regresión múltiple ejemplo Un coeficiente positivo indica una relación directa entre esa variable independiente y la variable dependiente. Además. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. El número de clientes pertenecientes al grupo de muestra con hijos es igual a 120 y el del grupo sin hijos es de 80. 9 10 Análisis discriminante D= b0 +b1X1+b2X2+b3X3 + … bkXk Dónde: D = Puntuación discriminante bx = coeficientes o peso discriminante Xs = variables independientes Función discriminante. X1 = Costo de publicidad. 8 7 Análisis discriminante Este análisis busca generar dimensiones que permitan separar los objetos tanto como sea posible. (predictivo). Análisis discriminante Ejemplo Walt Mart está interesado en analizar la opinión de sus clientes con respecto a la tienda.

Para conocer la forma en que un conjunto de actitudes se relacionen con un conjunto de comportamiento. dependientes e interdependientes. Ejemplo. 18 D. y en caso de que existan. 2006.R. Análisis de Covarianza (ANCOVA) se utiliza en situaciones en donde se descubre después del experimento. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. El análisis multivariante nos permite analizar múltiples variables simultáneamente para entender la relación (distancia). correlación. para predecir la participación de mercados o la rentabilidad de un producto que ofrece varias combinaciones de atributos. El tamaño de la muestra es n=200 con n1 = 120 y n2 = 80. 3 . Se requiere una variable dependiente en escala de intervalos y variables independientes en escala nominal. El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que proporcione la correlación única máxima entre el conjunto de variables dependientes y el conjunto de variables independientes. Podemos definir dos técnicas multivariantes. que alguna fuente externa de variación contribuye a los valores de la variable dependiente.. agrupar datos o simplificar la estructura de estos.. N. 14 13 Medición conjunta Se ocupa de los efectos conjuntos de dos o más variables independientes nominales en la disposición de una variable dependiente ordinal. Del Paseo Residencial Monterrey. 15 Medición conjunta Ejemplo Resumen de Importancia de los atributos en la selección de un automóvil Importance summary 50 40 Averaged Importance Importancia promedio 30 20 10 0 Colour carro Color del of car Brand Name Marca Repairs for one yearTamaño del motor Seguridad Engine size as indic Factor 16 Correlación canónica Es apropiada cuando se tiene un conjunto de variables dependientes en escala de intervalos y un conjunto de variables independientes. existen 7 variables clasificadoras (p=7) y dos grupos a discriminar (q=2). analizar en qué sentido se dan dichas diferencias. 17 Que hemos aprendido hasta hoy.L. Se utiliza para medir los intercambios que los consumidores hacen sobre atributos de productos. En este caso.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Varianza y Covarianza El objetivo del estudio es analizar si existen diferencias en cuanto a la percepción de la tienda entre los clientes con hijos y los clientes sin hijos. Es útil en el diseño de nuevos productos o servicios. Análisis de Varianza (ANOVA) se utiliza en el análisis de datos experimentales. Requiere una variable dependiente en escala de intervalos y una variable o variables independientes en escala nominal. En las técnicas dependientes una o más variables pueden identificarse como dependientes (el resultado estudiado o evento) y las demás variables como independientes..

México: Editorial Thomson 2005. 19 20 Créditos: Lic. N. • Kinnear. un enfoque práctico.. México: Editorial Pearson Educación 2004. Una variable dependiente: Regresión Múltiple. • Mc Daniel. (ISBN 970-686-366-4). Varianza y Covarianza. Medición Conjunta. Del Paseo Residencial Monterrey. Naresh. Análisis Discriminante. Carl. 2006. Ana María López Navarro 21 D. Múltiples variables dependientes: Correlación Canónica • Malhotra. 4 . Investigación de Mercados. Thomas. un enfoque aplicado. (ISBN 958-600-124-5). México: Editorial Mc Graw Hill 1996. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.R. Investigación de Mercados. Investigación de Mercados.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Bibliografía Los métodos estadísticos a utilizar dependen de si tenemos una o más variables dependientes y el tipo de escala de los datos. (ISBN 970-26-0491-5).L.

54 Factor B (seguidores) X2 5 6 D.95 1.15 0.85 1. Interpretación de factores Factor A (Innovadores) X1. (se lee como correlación).35 0. 2006. Se le asigna a cada factor un nombre creativo que identifique el conjunto de variables. hasta qué grado y en qué dirección. Rotación de factores iniciales.R.38 .00 X2 0.48 .20 0.00 En este ejemplo se tienen 4 variables y mediante la matriz de correlaciones se identificaron 2 factores (A y B) Las cargas de la matriz de factores miden cuáles variables están involucradas en qué patrón factorial..Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Análisis multivariante Técnicas Multivariantes AM04003-Análisis e interpretación de resultados Sesión 19. analiza el conjunto completo de la interrelación de las variables.70 .63 . Extracción de factores de la matiz de correlación. Pasos: 1. 3. Enfoque en variables Análisis Factor Común Enfoque en objetos Análisis Conglomerado (Cluster) Escalas Multidimensionales Análisis de factor común Procedimiento que selecciona un gran número de variables u objetos y se investiga si tienen un numero pequeño de factores en común que expliquen su intercorrelación. N.00 X3 0. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. correlaciones entre variables – Factor Q.L. 3 4 Análisis de factor común Ejemplo Matriz de correlación X1 X1 X2 X3 X4 1. correlación entre casos 2.26 -. Matriz de correlación entre variables: – Factor R.53 . 1 .75 1. x4 Rotación de Factores Variable X1 X2 X3 X4 A .76 B . X3.00 X4 0. Análisis multivariante: técnicas interdependientes Técnicas de Dependencia Una Variable Dependiente Técnicas de Interdependencia Interdependencia variables Semejanza entre objetos Mas de una variable dependiente Regresión Múltiple Correlación Discriminante Canónica Medición Conjunta Varianza y Covarianza 1 Análisis Conglomerado Factor Común Escala Multidimensional 2 Técnicas interdependientes No hace diferencias entre variables dependientes e independientes. Del Paseo Residencial Monterrey.

2006.L. sin distinguir variables dependientes. Podemos definir dos técnicas multivariantes. – MDS muestra la relación entre las variables colocándolas en una espacio multidimensional.R. Alta calidad. Refrescante.. los grupos no están pre-definidos. Escala multidimensional MDS Ejemplo MDS Análisis para los refrescos: – Coca Cola. Se utiliza en preferencias por marcas o tiendas. Alto contenido de azúcar. Dendograma. 12 D. 2 . Sprite – Variables que los consumidores clasificaron en 6 atributos: • Buen sabor. Big Cola. Barato. © Universidad TecMilenio Lázaro Cárdenas #2610 Col.. Del Paseo Residencial Monterrey. Pepsi.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Análisis conglomerado El objetivo es clasificar una muestra de entidades (personas u objetos) en un número pequeño de grupos mutuamente excluyentes basados en similitudes entre las entidades. ∗BIG COLA Alto en azúcar ∗FANTA Buen sabor ∗COCA COLA ∗PEPSI Alta calidad Refrescante ∗SPRITE Quita la sed 11 Las técnicas interdependientes analizan el conjunto completo de la interdependencia de las variables. Quita la sed. las cuales fueron definidas por los atributos de los refrescos. dependientes e interdependientes. Por consiguiente. Análisis conglomerado Ejemplo Se utiliza en: Segmentación de Mercado. En el análisis conglomerado. definición del mercado meta. Se utilizan mapas preceptúales de dos o más dimensiones para tener un diagrama visual de las preferencias y percepciones. el MDS ilustra la posición de los refrescos en la mente del consumidor. se usa la técnica para identificar los grupos de casos u observaciones relativamente homogéneos.. agrupar datos o simplificar la estructura de éstos. N. Objeto 1 Objeto 2 Objeto 3 Objeto 4 Objeto 3 Objeto 6 Distancia 7 8 Escala multidimensional MDS Obtiene las dimensiones de los juicios de los encuestados sobre la similitud o preferencias de los productos transformándolos en distancias. El análisis multivariante nos permite analizar múltiples variables simultáneamente para entender la relación (distancia). – Con estas dimensiones. 9 10 Mapa perceptual refrescos Ejemplo Barato Que hemos aprendido hasta hoy. correlación. a diferencia del análisis discriminante. posicionamiento de productos y desarrollo de nuevos productos. Se mide las distancia entre las similutues/diferencias de los objetos o de la matriz de correlación para hacer Agrupamientos. Fanta.

Carl. Investigación de Mercados. los métodos estadísticos para las técnicas interdependientes están en función de esta clasificación.R. un enfoque aplicado. Escalas Multidimensionales MDS • Malhotra.L.. México: Editorial Mc Graw Hill 1996. 3 . (ISBN 958-600-124-5). Enfoque en variables: Análisis de Factor Común Enfoque en objetos: Análisis Conglomerado (Cluster). Thomas. N. Ana María López Navarro 15 D. 13 14 Créditos: Lic. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Del Paseo Residencial Monterrey. Naresh. (ISBN 970-686-366-4). 2006. un enfoque práctico. • Kinnear. • Mc Daniel. México: Editorial Thomson 2005.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Bibliografía Se puede clasificar si se tiene enfoque a objetos o a variables. Investigación de Mercados. México: Editorial Pearson Educación 2004. Investigación de Mercados. (ISBN 970-26-0491-5).

los objetivos. el alcance. los hallazgos. Antes del reporte escrito Interpretación de los hallazgos Preparación del Informe Reporte Escrito Presentación Oral Después del Reporte Escrito SEGUIMIENTO Lectura por parte del cliente • Ser conciso y preciso – Seleccionar la información de manera de no meterse en detalles. las limitaciones y finalmente las recomendaciones del proyecto de investigación. etc. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. rangos. la metodología. • Tener en cuenta las necesidades de información – Asegurar la relación de los hallazgos con los objetivos gerenciales. N. AM04003-Análisis e interpretación de resultados Sesión 20. breve – Palabras y frases cortas – Ser conciso – Apariencia (utilización de espacios) – Información estadística visual – Utilizar tiempo presente – Voz activa – No modismos – Colocar citas de los encuestados D. – En ocasiones una imagen o gráfica dice más que mil palabras. • Objetividad – No sesgar ni favorecer la información.R. • Es más que un resumen de lo investigado.L. • Comunicación Definir un estilo de redacción considerando: – Lenguaje de negocios. redondeo. pero si enfocarse en las necesidades de información al momento de redactar el informe. es un registro del proceso de investigación...Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Qué es un reporte de investigación. Presentación de resultados Proceso de preparación del reporte Definición del problema Diseño de investigación Metodología Análisis de Datos Consideraciones para la elaboración del Informe escrito • Considerar la audiencia objetivo – Empezar con lo simple – Definir términos técnicos – Utilizar palabras sencillas que conozcan los lectores – Utilizar ayudas gráficas o visuales – Facilitar la lectura de cifras. la hipótesis. utilizando porcentajes. • Es el ultimo paso del proceso de la investigación de mercados. • Un documento escrito y/o una presentación oral basada en la documentación escrita que comunica el propósito. Del Paseo Residencial Monterrey. debe presentarse los hallazgos y defender su validez en caso necesario. – Entender la información y dar conclusiones interpretativas de éstas. – No repetir información innecesaria.. 2006 1 .

D. plan muestral. 2006 2 . el método de recolección. etc) Resumen ejecutivo Cuerpo del informe Conclusiones y recomendaciones Apéndice • • • • Portada Titulo que trasmita la esencia del estudio. Debe incluir: – Objetivos de la investigación – Naturaleza del problema de decisión – Resultados – Conclusiones (opiniones basadas en la investigación) – Recomendaciones Cuerpo del informe • Introducción – Información básica del proyecto. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. • Metodología – Describir la naturaleza del diseño de la investigación.R. • Contiene los títulos y la paginación de todos los apoyos visuales incluidos. especificar las fuentes de datos. Tipo de investigación exploratoria o concluyente. Del Paseo Residencial Monterrey. procedimiento de recolección y análisis de datos. Resumen ejecutivo • Abreviación o síntesis de los aspectos importantes de la investigación. ya que algunos ejecutivos solo es lo que leen del informe. naturaleza del problema de decisión y objetivos.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Formato del informe escrito • • • • • • • Portada Tabla de contenido Índice de tablas ( gráficas. imágenes. N. • Limitaciones – Apartado cuya finalidad es permitir al lector juzgar la validez. figuras. atractivo que invite y despierte el interés por la lectura Fecha Organización o persona que lo emite o presenta Organización o personas a quien va dirigido Tabla de contenido • Secuencial de los temas que se cubren en el informe y paginación • Objetivo. Ayudar en la identificación rápida de los temas de interés Índice de tablas • Puede ir junto con la tabla de contenido o por separado.. deben facilitar el emprender una acción. • Debe tener los hallazgos de mayor impacto.L. Cuerpo del informe • Resultados – Flujo lógico de información para el propósito de toma de decisiones. – Entre las limitaciones se involucran las insuficiencias del muestreo. – Es un resumen de los aspectos técnicos que desarrolla la confiabilidad de la investigación.

se debe comenzar con ideas en común. tal como formatos de recolección. N. 3) Dígales que les dijo. Gráficas Presentación de datos (números. de barras). Tener un plan de contingencia en caso de falla de equipo. Analizar la audiencia. Apéndice – Material no esencial. tendencias y relaciones) en términos de tamaño interpretados visualmente.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Conclusiones – Relación de los hallazgos de la investigación con las necesidades de información. Principio SIDI: Hágalo simple y directo.L. detalles del plan de muestreo. estimativos. Pictogramas Despliegue de datos con imágenes o símbolos pequeños. instrucciones. polígono de frecuencia. Antes de la presentación • • • • • Verificar equipo y material a utilizar. 2006 3 . pero relacionado con el objeto de estudio. Presentación Oral La clave para una presentación eficaz es la preparación. Del Paseo Residencial Monterrey. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. Practicar la presentación varias veces. Mapas geográficos o perceptuales Representan ubicación relativa y/o dimensiones. D. pueden formularse recomendaciones. como será la reacción.R. estadísticas. Elementos de los apoyos visuales: Número de la tabla o figura Título del contenido de la tabla Títulos horizontales y verticales Organización Bases de las mediciones Notas de pie de página Tipos de Presentación de los datos Tabular Presentación numérica de datos. • Graficas de barras (representa magnitud).. Las más utilizadas son: • Graficas de pastel (representa relaciones proporcionales). • Graficas de línea (representa tendencias) (histograma. • • Cuidar el lenguaje corporal. 2) Dígales. Presentación de los datos Se utilizan apoyos visuales como gráficas o tablas para la presentación de datos cuantitativos o procesos técnicos. Principio “Dígales”: 1) Dígales que va a decir.

un enfoque aplicado. Ana María López Navarro D. Naresh. México: Editorial Pearson Educación 2004. 2006 4 .. Créditos: Lic. Bibliografía • Malhotra. Utilizar notas para evitar olvidar algún punto y dar una secuencia ordenada a la presentación. Investigación de Mercados. no inventar respuestas. © Universidad TecMilenio Lázaro Cárdenas #2610 Col. • Mc Daniel. Del Paseo Residencial Monterrey. simples y fáciles de interpretar. (ISBN 958-600-124-5). México: Editorial Thomson 2005. • Kinnear. No dar la espalda a la audiencia.L.R. Thomas. Evitar poses o movimientos innecesarios. (ISBN 970-686-366-4). Utilizar apoyos visuales. un enfoque práctico. Carl. dirigirse a las personas. Preguntar si quedo alguna duda (repetir la pregunta. Investigación de Mercados. México: Editorial Mc Graw Hill 1996. Evitar muletillas o modismos. Evitar leer un guión.Universidad Tec Milenio: Profesional AM04003 – Análisis e interpretación de resultados Durante la presentación • • • • • • • • Empezar con una visión general. Investigación de Mercados. ser breve). N. (ISBN 970-26-0491-5).

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->