Analisis e Interpretacion de Resultados

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados
Conceptos Bsicos
Elemento: Es la unidad acerca de la cual se solicita informacin. En una investigacin con encuestas, por lo regular el elemento es el entrevistado.
AM04003-Anlisis e interpretacin de resultados

Sesin1. La importancia del muestreo
Poblacin meta: Es el conjunto de todos los elementos definidos antes de la seleccin de la muestra y que posee la informacin que busca el investigador. Una poblacin definida adecuadamente debe definirse en trminos de ELEMENTOS, UNIDADES DE MUESTREO, ALCANCE y TIEMPO. Ejemplos:
Conceptos Bsicos
Si deseamos monitorear las ventas de un nuevo producto, como un jabn de tocador, la poblacin podra ser: ELEMENTO: Jabn de tocador UNIDADES DE MUESTREO: Supermercados, farmacias, almacenes de descuentos, tiendas de abarrotes. ALCANCE: Monterrey TIEMPO: 6 al 20 de enero de 2007
Conceptos Bsicos
La poblacin para medir la reaccin de un comprador hacia un nuevo producto qumico industrial sera: ELEMENTO: Ingenieros Qumicos UNIDADES DE MUESTREO: Empresas que compran mas de 2 millones de pesos en qumicos por ao. ALCANCE: La zona norte de la Repblica Mexicana TIEMPO: 2007
Unidad de muestreo
Es el elemento o elementos disponibles para su seleccin en alguna etapa del proceso de muestreo. En el tipo de muestreo ms simple, que sera el de una sola etapa, las unidades y los elementos de muestreo son los mismos. En el caso de procedimientos ms complejos, se pueden tener el nmero de etapas que el investigador desee, lo que se tiene que hacer es especificar la unidad de muestreo en cada una de las etapas.
Conceptos Bsicos
Por ejemplo, una muestra en tres etapas podras ser: Etapa 1: Ciudades con poblacin de mas de 800,000 habitantes. Etapa 2: Colonias de nivel socioeconmico C+ Etapa 3: Mujeres de 40 aos y ms
D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.
Marco muestral o de referencia

Representacin de los elementos de la poblacin meta que consiste en una lista o grupo de indicaciones para identificar a la poblacin meta. Un ejemplo de esto podran ser una lista de clase, una lista de votantes registrados, una lista de empleados, directorio telefnico y hasta un mapa. En el caso del mapa se estaran muestreando partes geogrficas, como por ejemplo, colonias, cuadras o manzanas dentro de una ciudad.
Por qu una muestra?

La alternativa al muestreo es realizar un censo, en el cual se estaran utilizando todos los elementos disponibles de una poblacin definida, como el censo poblacional que realiza el gobierno, por parte de INEGI. Los censos casi no se utilizan en la investigacin de mercados, debido a que las poblaciones de inters por lo comn incluyen miles o millones de individuos; aunque hay casos en el que un censo puede ser til para una empresa de productos industriales que slo tiene un pequeo nmero de clientes de un producto altamente especializado.
Beneficios del muestreo
1. Ahorra dinero: claramente ahorraramos dinero entrevistando a 1000 personas en vez de un milln de personas que compondran un poblacin dada, en caso de hacer un censo. 2. Ahorra tiempo: definitivamente no sera lo mismo entrevistar a un milln de personas que slo a 1000, en el caso de una muestra.
3. Puede ser mas preciso: a pesar de lo que pueda parecer, cuanto ms pequeo sea un estudio, mayores sern las posibilidades de controlar al personal en cada una de las etapas del proceso de muestreo. Entre ms personal se utilice, y ms tiempo se lleve el estudio, habr ms errores y resultados menos exactos.
10
Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).
Crditos:
Lic. Ana Mara Lpez Navarro
11
12
Proceso de Muestreo
Definir la poblacin Identificar el marco muestral Seleccionar un mtodo de muestreo Determinar el tamao de la muestra Ejecutar el plan

Sesin 2. Procedimiento de muestreo
1. Definir la poblacin
La poblacin se debe definir en trminos de: Elementos Unidades de muestreo Alcance Tiempo
1. Definir la poblacin
Los datos demogrficos tales como edad, ingreso, nivel de estudios, etc., se utilizan mucho para definir a la poblacin. Tambin los estilos de vida se pueden considerar, o bien condiciones de vida como tener poco tiempo disponible para dormir, comer, etc. Por ejemplo, si queremos hacer una investigacin para pastillas de cafena, debemos asumir que una de las caractersticas de la poblacin meta debe ser que tenga poco tiempo para dormir, como pueden ser choferes, doctores, enfermeras, etc.
3 4
2. Identificar el marco muestral

Ya que se ha definido la poblacin, el investigador debe buscar un listado que le sirva como marco muestral. Existen algunas fuentes tanto privadas como pblicas que pueden servir, pero hay que considerar que todas tienen un grado de error muestral, hay que evaluar bien las fuentes y buscar la que mejor represente a la poblacin meta.

Para evaluar el error muestral en una lista, y ver si le puede servir al investigador, hay que considerar dos puntos: Evaluar el grado de afinidad de las caractersticas del marco muestral con los de la poblacin meta. Estimar la cantidad de personas no listadas de la poblacin meta.

Para evaluar el grado de afinidad de los miembros de la lista con los de la poblacin meta se utiliza un rango de incidencia que son los que calificaran para la muestra. Esto se puede hacer en una encuesta con preguntas de filtro, para poder descartar a las personas que no califican.

Para el segundo punto, si el investigador determina que la cantidad de miembros no considerada dentro de la lista no representa un error considerable para la muestra final, la puede juzgar como aceptable. Por ejemplo, en un club deportivo, puede ser que se tomen en cuenta solamente los registrados en Internet, pero hay unos cuantos que no estn registrados, ms sus hbitos de consumo no difieren en la opinin de los registrados, por lo cual podra ser vlido el marco muestral.
3. Seleccionar un mtodo de muestreo

Mtodos de Muestreo
4. Determinar el tamao de la muestra

Nmero de elementos que se incluirn en la muestra. Los factores cualitativos que se deben considerar son: Importancia de la decisin Naturaleza de la investigacin Nmero de variables Naturaleza del anlisis Tamaos de muestra utilizados en estudios similares Tasas de incidencia Tasas de cumplimiento Restricciones de recursos $
10
No Probabilsticos
Probabilsticos
Por juicio
Por cuotas
Aleatorio simple Sistemtico
Estratificado
Bola de nieve
Por conveniencia
De grupo o agrupamientos
4. Determinar el tamao de la muestra

En estudios concluyentes se deben tomar en cuenta factores como: Desviacin estndar de la media Nivel de confiabilidad Error estndar En estudios de naturaleza exploratorio las muestras tienden a ser ms pequeas, en estudios concluyentes las muestras deben ser ms grandes.
11
5. Ejecutar el plan
En esta etapa de deben desarrollar procedimientos operacionales para la seleccin de la muestra. Por ejemplo, en el caso de una encuesta casa por casa, es muy importante tener un manual detallado para los entrevistadores, ya que debe eliminarse la participacin de ellos al mximo, y debe especificarse detalladamente la ruta a seguir, el salto de casas, instrucciones si la casa est vaca, si no se encuentran, si hay terrenos baldos, etc.
12
5. Ejecutar el plan
En una muestra probabilstica es de suma importancia cuidar los procedimientos, ya que son factores crticos de xito, y muchas veces la ejecucin es la que puede constituir un obstculo para toda la investigacin.
Bibliografa
13
14
Crditos:
15
Universidad Tec Milenio: Profesional AM04003 Anlisis en interpretacin de resultados
Muestreo no probabilstico
De conveniencia

Sesin 3. Muestreo no probabilstico
De juicio Por cuotas Bola de nieve
Muestreo de conveniencia
Las muestras por conveniencia se seleccionan, como su nombre lo dice, de acuerdo a la conveniencia del investigador. Es muy utilizado por las empresas debido a su bajo costo y facilidad de ejecucin. Ejemplos: Realizar entrevistas en un centro comercial. Utilizar grupos de estudiantes de cierta universidad. Entrevistar a las personas que pasen por cierta calle.
Muestreo de juicio
Se aplica a cualquier muestra en la que los criterios de seleccin se basan en el criterio del investigador acerca de lo que constituye una muestra representativa. Por ejemplo, en una prueba de comercializacin se hace un juicio con respecto a qu ciudades podran considerarse como las mejores para lanzar un nuevo producto.
Muestreo por cuotas

Se seleccionan de manera que las caractersticas demogrficas de inters para el investigador estn representadas en la muestra en las proporciones meta. Es decir, las cuotas aseguran que la composicin de la muestra se la misma que la de la poblacin en relacin a las caractersticas de inters.
Muestreo por cuotas
Ejemplo:
Caracterstica de control Sexo Masculino Femenino Composicin de la poblacin Porcentaje 45% 65% Composicin de la muestra Porcentaje 45% 65% Nmero 450 650
Universidad Tec Milenio: Profesional AM04003 Anlisis en interpretacin de resultados
Bola de Nieve
En este mtodo se selecciona un grupo inicial de encuestados, generalmente al azar; despus de ser entrevistados se les pide que identifiquen a otros que pertenecen a la poblacin de inters. Este proceso es como una cadena, una referencia lleva a otra y as sucesivamente, por eso del nombre bola de nieve.
Bola de Nieve
Un ejemplo comn de este mtodo es cuando te llaman por telfono para ofrecerte una tarjeta de crdito, posteriormente te piden si puedes proporcionarles los datos de algn familiar o conocido que pudiera estar interesado en la tarjeta de crdito tambin. Tambin empresas de Internet como Terra te llaman para ofrecerte los servicios, te preguntan informacin y posteriormente te piden datos de algn posible interesado en los servicios.
Bibliografa
Crditos:
10
Muestreo probabilstico
Cada elemento de la poblacin tiene la misma probabilidad de ser seleccionado para la muestra, hay cuatro tipos:

Sesin 4. Muestreo probabilstico
Aleatorio simple Sistemtico Estratificado Por agrupamiento

1 2
Muestreo aleatorio simple

Es la forma ms pura del muestreo probabilstico y se realiza a partir de una lista de la poblacin. El procedimiento para realizarlo es: 1. Seleccionar un marco muestral. 2. Asignar a cada elemento un nmero del 1 al N (tamao de la poblacin). 3. Generar n (tamao de la muestra) nmeros aleatorios diferentes entre 1 y N. Esto se puede hacer mediante programas computacionales o tablas de nmeros aleatorios. 4. Los nmeros generados denotan los elementos que debern incluirse en la muestra.
Muestreo aleatorio simple

Ejemplo para utilizar una tabla de nmeros aleatorios:
PASO 1. Asigna a todos los miembros de la poblacin un nmero. (supongamos que tenemos una lista de 30)
PASO 2.
Selecciona cualquier nmero en la tabla de nmeros aleatorios como punto de partida y encuentra el primer nmero que corresponda a la lista de la poblacin. En este ejemplo hemos seleccionado el nmero 32 como punto de partida.
75 55 16 29 26 27 58 48 50 30 49 17 93 05 59 43 28 51 18 81 59 01 10 32 94 99 44 09
Nombre Lpez, Ricardo Prez, Luis Flores, Ana Sosa, Eva Aldape, Josu Bonilla, Erik
Nmero 1 2 3 4 5 30
5
23 65 03 38 96 11 43
15 54 87 97 31 74 36
Punto de partida: Nos moveremos hacia la izquierda hasta el final de la fila, despus hacia abajo y hacia la derecha, posteriormente hacia abajo y as sucesivamente, en zig-zag.
PASO 3. Selecciona a la persona que corresponda a los nmeros de la lista, como vayan apareciendo, en este caso aparecen primero el 28, posteriormente el 30, luego el 16 y sigue el 87, que no lo incluye nuestra lista, este lo saltamosllevamos por lo pronto a las siguientes personas: #28 Brito, Javier #30 #16 Bonilla, Erik Garza, Alicia
Muestreo sistemtico
El muestreo sistemtico se utiliza a menudo como sustituto del muestreo aleatorio simple, produce muestras casi idnticas a las generadas por el simple aleatorio, pero es ms sencillo de aplicar. El procedimiento es:
PASO 4. Continuamos de la misma forma hasta completar el nmero completo de elementos para la muestra. Si encuentras un nmero que ya seleccionamos anteriormente, simplemente lo saltamos y seguimos en la seleccin.
7 8
PASO 1. Identifica un listado de la poblacin que contenga un nivel aceptable de error. Ejemplo: El directorio telefnico de tu ciudad. PASO 2. Calcula el intervalo de salto dividiendo el nmero de nombres de tu lista entre el nmero de la muestra. Ejemplo: 25,000 nombres en el directorio = 50 Muestra de 500 personas
PASO 3. Utilizando nmeros aleatorios, determina el punto de partida en la lista. Ejemplo: Selecciona un nmero aleatorio para la pgina del directorio donde se comenzar. Selecciona un nmero aleatorio para seleccionar la columna. Selecciona un nmero aleatorio para el rengln de la columna donde se comenzar, vamos a decir que ya seleccionando los puntos anteriores, empezaramos en Fuentes, Pedro.
El intervalo de salto sera cada 50 personas o nombres.
10
PASO 4. Aplica el intervalo de salto para determinar los nombres de la lista que se incluirn en la muestra. Ejemplo: Si empezamos en Fuentes, Pedro, saltamos 50 nombres y seleccionamos el siguiente.
PASO 5. La lista se maneja de manera circular, es decir, el primer nombre que se seleccion aleatoriamente, ser el ltimo de la lista al ir avanzando. Ejemplo: Empezamos en la F de Fuentes, seguiramos seleccionado hasta llegar a la Z, donde continuaramos en la letra A hasta llegar, en dado caso, nuevamente a la letra F.
11
12
Muestreo estratificado
Las muestras estratificadas son las muestras probabilsticas que se distinguen por los siguientes pasos en el procedimiento: 1. La poblacin original o principal, se divide en dos o ms subconjuntos mutuamente excluyentes y extensivos. (por ejemplo, hombre y mujer) 2. Las muestras simples aleatorias de los elementos de los dos o ms subconjuntos se eligen independientemente una de la otra.
Procedimiento
1. Seleccionar un marco muestral. 2. Seleecionar las variables de estratificacin y el nmero de estratos. 3. Dividir la poblacin completa en H estratos, con base en la variable de calificacin, cada elemento de la poblacin es asignado a uno de los estratos H. 4. En cada estrato, numerar los elementos del 1 al Nh (tamao de la poblacin del estrato H).
13
14
Ejemplo: 5. Determinar el tamao de la muestra de cada estrato, nh, con base en muestreo estratificado proporcionado o desproporcionado: H nh = n
h=1
6. En cada estrato, seleccionar una muestra aleatorio simple de tamao nh.
Supongamos que en Zacatecas, 70% de los nios de primaria van a escuela pblica y el 30% a privadas. Si queremos 1,000 nios, lo que haremos es dividir los alumnos en 2 estratos (pblica y privada) y se eligen aleatoriamente 700 nios de la pblica y aleatoriamente 300 de la privada.
15
16
Muestreo por agrupamiento

En el muestreo por conglomerados o agrupamiento, en lugar de considerar cada elemento de la poblacin, lo que consideramos son conglomerados de elementos. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estar formada por TODOS los elementos de los conglomerados. Ejemplos: -En las encuestas durante las elecciones, los conglomerados pueden ser las mesas electorales, y lo que se hace es escoger algunas mesas al azar (y de ah se toman todos los votos de las mesas seleccionadas). -En otros ejemplos, los conglomerados pueden ser las colonias de viviendas, los municipios, etc.
17
18
Bibliografa
Crditos:
19
20
Mtodos
Existen 5 enfoques o mtodos para calcular el tamao de la muestra:

Sesin 5. Tamao de la muestra
Enfoque Arbitrario Enfoque Convencional Enfoque basado en el costo Enfoque Estadstico Enfoque del Intervalo de Confianza
Enfoque Arbitrario
Este enfoque se basa en una regla fija, donde una muestra debe ser al menos el 5% de la poblacin total para poder ser confiable. Este enfoque es muy fcil de aplicar, pero no es eficiente ni econmico.
Enfoque Convencional
Este enfoque se refiere a utilizar un tamao convencional de muestra para el investigador. El nmero convencional puede ser el promedio de tamaos de muestra en estudios similares o puede ser el mismo tamao de muestra que utiliz la competencia en un estudio similar. La diferencia entre el enfoque convencional y el arbitrario es que el convencional puede tener cierta lgica, y el arbitrario no, se usa el 5% indistintamente.
Enfoque basado en costo

Este enfoque utiliza el presupuesto disponible de la empresa para determinar el tamao de la muestra. Si no hubiera costos definidos para el investigador, todo podra ser manejado con censos. En este enfoque es importante valorar la importancia de los resultados de la investigacin para la toma de decisiones, ya que a veces es conveniente considerar un ajuste en el presupuesto.
Enfoque Estadstico
En este mtodo el tamao de la muestra es determinado por los anlisis estadsticos que van a ser utilizados, ya que ciertos anlisis necesitan un mnimo de tamao para que los resultados obtenidos sean confiables y aptos para la toma de decisiones. Los anlisis estadsticos se utilizan para analizar subgrupos dentro de una muestra. Se analizan aspectos por edades, sexo, estado civil, etc.
Intervalo de confianza
Existe slo un mtodo que permite al investigador PREDETERMINAR la exactitud de los resultados de la muestra y es el de intervalo de confianza. Este mtodo aplica conceptos de variabilidad, intervalo de confianza, distribucin de la muestra y error estndar de la media para crear un tamao de muestra vlido. Este es de los mtodos ms comnmente utilizados por los investigadores. A continuacin veremos cada uno de los factores considerados en este enfoque.
7
Este mtodo est basado en dos premisas bsicas: Intervalo de confianza: Es el rango en donde las terminaciones o colas definen un cierto porcentaje de las respuestas a una pregunta. Teorema del lmite central: Es una teora que sostiene que los valores estadsticos tomados repetitivamente de la muestra en una investigacin tienen una distribucin normal.
8
Recordamos los dos tipos de errores: Error de No Muestreo Error de Muestreo o error muestral: Este es el tipo de error que estaremos controlando mediante las frmulas. Frmula de error muestral :
Error muestral % veces
Relacin entre el tamao de la muestra y el error muestral:
Relacin precisin/tamao de la muestra

Para una muestra de 1,000 o ms se gana muy poca precisin, inclusive si se dobla la muestra a 2,000.
Precisin
Tamao de la muestra
10
Variabilidad: se refiere a qu tan similar o diferentes son las respuestas a una pregunta dada. P : Porcentaje Q : 100% - P Punto importante: A mayor variabilidad en la poblacin estudiada, mayor ser el tamao de la muestra requerida para cumplir con un nivel de precisin estipulado.
Qu hemos aprendido hasta ahora? Existe una relacin entre:
El nivel de confianza que queremos que tengan nuestros resultados La variabilidad de la poblacin y La cantidad de error muestral aceptable (precisin deseada) que queremos tener y El tamao de la muestra!
11
12
Existe una frmula que conjuga todos estos factores, sta es la que considera porcentajes:
n= z2(pq) e2
Frmula para calcular el tamao de la muestra que considera una media:
n= s2 z2 e2
Dnde: n = tamao de la muestra z = error estndar asociado al nivel del confianza seleccionado p = porcentaje estimado de la poblacin q = 100 p e = error muestral aceptable
13
Dnde: n = tamao de la muestra z = error estndar asociado al nivel del confianza seleccionado s = variabilidad indicada por una desviacin estndar estimada e = error muestral aceptable
14
Cmo estimar la variabilidad ( p q ) en la poblacin? Esperar el peor de los casos (p=50; q=50) Estimar la variabilidad: Existen estudios anteriores? Se conducir un estudio piloto?
Cmo determinar el nivel de error muestral? El investigador debe ponerse de acuerdo con los gerentes para definir esta decisin, qu tanto error estn dispuestos a tolerar? Lo convencional es 5%. Entre ms importante sea la decisin, menor deber ser el error.
15 16
Cmo determinar el nivel de confianza? El investigador debe ponerse de acuerdo con los gerentes para definir esta decisin, a mayor nivel de confianza, mayor tamao de la muestra. Lo convencional es 95%. (z=1.96) Entre ms importante sea la decisin, mayor deber ser el nivel de confianza, 99% de confianza, z=2.58
17
Factor de correccin de la poblacin finita

Es un ajuste al tamao de la muestra que se hace en los casos donde la muestra es igual a 5% ms de la poblacin total. Generalmente sucede en mercados muy especializados donde la poblacin total es pequea, como el mercado industrial o mdico.
18
Factor de correccin de la poblacin finita

Este clculo se hace utilizando la siguiente frmula: nN N+n-1
Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).
n =
Donde: n = tamao revisado de la muestra n = tamao original de la muestra N = tamao de la poblacin
19
20
Crditos:
21
Planeacin de las operaciones de campo

Como contexto general, existen cuatro aspectos que son comunes en las operaciones de campo:

Sesin 6. Planeacin del trabajo de campo
1. 2. 3. 4.
Programacin del tiempo Presupuesto Trabajadores de campo Medicin del desempeo
Programacin del tiempo

Cualquier proyecto debe incluir una programacin del tiempo que especifique: Comienzo e inicio del proyecto Secuencia de actividades dentro del tiempo especificado (usualmente se utiliza una grfica de Gantt)
ACTIVIDADES

Ejemplo:
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Borrador del cuestionario de prueba Seleccionar la muestra de prueba Seleccionar los entrevistadores de prueba Preparar el material de capacitacin Capacitar a los entrevistadores Realizar entrevistas de prueba Evaluar los resultados de la prueba Afinar cuestionario segn resultados de prueba Seleccionar personal de campo Preparar material de capacitacin Capacitar personal de campo Realizar entrevistas Validacin del trabajo de campo Evaluacin del personal de campo Informe final de campo
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 OCTUBRE 1 2 3 4 5 6 7 NOVIEMBRE
Es necesario detallar el nmero de das para cada actividad pero que sean realistas, ya que a veces los proyectos se atrasan por fijar metas inalcanzables.
3

Cuando son proyectos muy largos, es necesario realizar una grfica general, y otras especficas por actividades o bloques de actividades. Debe estar muy clara la calendarizacin del proyecto, ya que deben cumplirse los tiempos establecidos.
Presupuesto
Se deben asignar costos a cada una de las actividades del programa, los costos estn directamente relacionados, ya que un cambio en alguna actividad afecta a otra y el presupuesto se puede ver modificado. Hay que detallar lo mejor posible cada uno de los rubros, y si es necesario, asignar un fondo de reserva para cubrir contingencias imprevistas.
Presupuesto
Para un estudio basado en entrevistas personales, por ejemplo, las principales categoras de costos son: Sueldos y salarios administrativos Materiales y suministros Telfono Supervisores de campo o servicios por entrevistas Salario de entrevistadores etc.
7
Personal
El xito del trabajo de campo depende principalmente en la calidad del personal, es necesario realizar una cuidadosa seleccin y capacitacin para poder exigir tiempos y el cumplimiento de adecuado de las actividades. Es necesario que el personal entienda claramente sus responsabilidades y la forma de medir su desempeo.
Medicin del desempeo

Es necesario tener un control por escrito para poder evaluar el desempeo individual del personal. Se requieren mediciones claras y fciles de entender. Muchas veces en caso de cuestionarios se evala por encuesta respondida, o en el caso de entrevistas, por el nmero realizado. Pero existe otra informacin importante como rechazos, casos de ausencia, etc., con la cual pueden hacerse comparaciones interesantes. A continuacin se presenta un ejemplo en el caso de entrevistas:
9
Medicin del desempeo

Ejemplo tabla de evaluacin, indicadores esperados y reales:
MEDIDA DE DESEMPEO 1. Total de encuestados elegibles 1.1 Entrevistas 1.2 Rechazos 1.3 No contactos 1.4 Otro (especifique) 2. Total de encuestados no elegibles 2.1 Se mudaron 2.2 Otro (especifique) 3. Muestra total 3.1 Tasa de respuestas 3.2 Tasa de rechazos 3.3 Tasa de contactos 3.4 Tasa de elegibilidad ESPERADO REAL
% % % %
% % % %
10
Mtodos de recoleccin de datos

Existen diferentes mtodos para la recoleccin de datos en una investigacin, y cada uno de ellos tiene sus particularidades. Los mtodos son: Entrevista personal Entrevista telefnica Entrevista por correo Entrevista por computadora Observacin
Bibliografa
Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).
11
12
Crditos:
13
Proceso del trabajo de campo y recopilacin de datos

Seleccin de los trabajadores de campo

Sesin 7. Trabajo de campo y recopilacin de datos
Capacitacin de los trabajadores de campo Supervisin de los trabajadores de campo Validacin del trabajo de campo
Evaluacin de los trabajadores de campo

1 2

El primer paso en el proceso de trabajo de campo es la seleccin, ya que las caractersticas , antecedentes, y actitudes del personal de campo afectan en las respuestas de los entrevistados. Entre mayor afinidad exista entre el personal de campo y el entrevistado, es mayor la probabilidad de que la investigacin sea exitosa.

Por lo cual, antes de seleccionar al personal, debemos definir los siguientes aspectos: Establecer los requerimientos del proyecto, de acuerdo al mtodo de recopilacin de datos. Definir las caractersticas necesarias en el personal de campo. Contratar al personal.
Capacitacin de los trabajadores de campo

Es muy importante tener bien capacitado al personal, ya que de eso dependen resultados uniformes durante la investigacin. Se deben especificar todos los aspectos del mtodo a utilizar, como: Primer contacto Realizacin de preguntas Sondeo Registro de respuestas Conclusin de entrevista
Primer Contacto
En el primer contacto se decide si el entrevistado coopera o no en la investigacin, por esto es muy importante capacitar al personal para que realice comentarios que inviten a participar en el estudio. Muchas veces no se debe preguntar al entrevistado si desea participar o no, sino ms bien ser asertivos y dar la pauta para empezar la entrevista. Hay que saber manejar objeciones y ser proactivos en la investigacin.
Realizacin de preguntas
Realizar preguntas correctamente no es una tarea fcil, cualquier cambio en la redaccin de la pregunta, entonacin, en el orden, puede alterar su significado y sesgar la respuesta. Es de vital importancia capacitar al personal y dar todos los detalles para preguntar de manera uniforme y sin sesgar al entrevistado. A continuacin se presentan algunos lineamientos para hacer preguntas:
Realizacin de preguntas
1. Conocer a fondo el cuestionario 2. Plantear las preguntas en el orden que aparecen en el cuestionario exclusivamente. 3. Utilizar exactamente las palabras que estn descritas en el cuestionario. 4. Leer cada pregunta pausadamente. 5. Repetir las preguntas que no haya sido entendidas. 6. Hacer todas las preguntas aplicables. 7. Seguir las indicaciones y esquemas de salto; sondear cuidadosamente.
8
Sondeo
Sondear significa motivar a los entrevistados para que elaboren, aclaren o expliquen sus respuestas; tambin es til para ubicar al entrevistado en el contenido de la entrevista y que slo proporcione informacin relacionada al estudio. A continuacin se presentan algunas tcnicas comumes de sondeo:
Sondeo
1. Repetir la pregunta, esto puedo estimular la respuesta. 2. Repetir la respuestas del entrevistado, esto sirve para alentar al entrevistado para que detalle ms de sus propios comentarios. 3. Hacer una pausa o silencio. Esto puede alentar a que el entrevistado complete ms su respuesta, pero esto no debe en tanto no sea incmodo.
10
4. Tranquilizar o impulsar al entrevistado. Si la persona entrevistada quiere que se le explique alguna pregunta, no se debe interpretar, se le comenta lo que signifique para usted. En el caso de que el entrevistado dude de sus respuestas, se le debe indicar no existen respuestas buenas o malas, queremos su opinin solamente. 5. Estimular las aclaraciones. Para que el entrevistado aclare ms sus respuestas se le pueden mencionar frases como, No comprendo bien su respuesta, sera tan amable de decirme algo ms por favor?
11
6. Hacer comentarios y preguntas neutras. Algunos comentarios que se utilizan para sondear se abrevian a lado de cada pregunta, deben ser objetivos y neutros como, Algo ms? (AM), Por qu opina as? (POA), Alguna otra razn? (AO)
12
Registro de las preguntas

Se debe especificar claramente el formato en el cual se deben registrar las preguntas. Todos los entrevistadores lo deben de hacer en la misma forma. Cada encuesta o entrevista es diferente, por lo tanto debe de tener indicaciones explcitas de cada punto. Como regla general, las respuestas abiertas se deben de registrar literalmente.
Registro de las preguntas

Por ejemplo, el Survey Research Center en la ciudad de Michigan, tiene los siguientes lineamientos: 1. Anote las respuestas durante la entrevista. 2. Utilice las mismas palabras que el entrevistado. 3. No resuma ni parafrasee las respuestas abiertas. 4. Incluya todo lo que concierna a los objetivos de la pregunta. 5. Incluya todos los sondeos y comentarios. 6. Repita la respuesta mientras la escribe.
14
13
Conclusin de entrevista
La entrevista no debe darse por concluida si se encuentra incompleta. El entrevistador no debe responder ninguna pregunta relacionada con el estudio. El entrevistado debe llevarse una sensacin positiva, es importante darle las gracias y expresar su aprecio.
Supervisin de los trabajadores de campo

Significa asegurarse de que se estn aplicando las tcnicas y procedimientos que se indicaron en la capacitacin. La supervisin abarca: Control de calidad y correcciones Control del muestreo Control de fraudes Control de la oficina central
15
16
Validacin del trabajo de campo

Se deben verificar al azar del 10 al 25% de los cuestionarios o entrevistas, donde se pregunte si efectivamente el entrevistador realiz las preguntas, la duracin de la entrevista, la calidad, y datos demogrficos bsicos. La informacin demogrfica se cruza con la registrada para verificar la autenticidad de las entrevistas.
Evaluacin de los trabajadores de campo

Se debe evaluar a los trabajadores de campo en base: Costos y tiempos Tasas de respuesta Calidad de la entrevista Calidad de los datos
17
18
Bibliografa
Crditos:
19
20
Errores en la recoleccin de datos de campo

El error de muestreo es slo uno de los dos tipos de error que afectan una investigacin.

Sesin 8. Errores en la recoleccin de datos de campo
El error de no muestreo incluye lo siguiente: Todos los tipos de error que no sean de muestreo Errores en la recoleccin de datos Errores en el manejo de los datos Errores de anlisis Errores de interpretacin
1 2
Errores no-muestrales
Tambin se incluyen errores en la definicin del problema, parafraseo de preguntas; pero generalmente el mayor potencial de error no-muestral se encuentra en la etapa de recopilacin de datos. Por lo cual, veremos este tema con mayor detalle, a continuacin se presenta una clasificacin de los errores no-muestrales:
Errores del trabajador de campo
Error de los entrevistados
Errores intencionales
1. 2. Fraude Guiar a una respuesta 1. 2. 3.
Errores no-intencionales
Caractersticas del entrevistador Malentendidos Fatiga
Errores intencionales
1. 2. Respuestas falsas No respuesta
1. 2. 3. 4. 5. Malentendidos Supuestos Prdida de atencin Distracciones Fatiga
Errores del trabajador de campo Intencionales

Fraude
Este ocurre cuando el trabajador de campo concientemente no est incluyendo informacin representativa de la muestra. Puede ser que est dando informacin falsa o que escoja a las personas que ms se le faciliten, no las que debe seleccionar. Esto muchas veces se da debido a que se paga por encuesta o entrevista completada.
Errores del trabajador de campo Intencionales

Guiar a una respuesta
Este ocurre cuando el trabajador de campo concientemente est guiando al entrevistado a que le responda algo en especfico. Puede ser mediante la pronunciacin, entonacin, lenguaje corporal o inclusive el parafraseo de un reactivo. Por ejemplo, no es lo mismo preguntar, Es el tema del gas un problema para usted?, que guiar la pregunta como, Acaso no es el tema del gas un problema para usted?
Errores del trabajador de campo No-Intencionales

Caractersticas del entrevistador
En este tipo de error influencian las caractersticas personales del trabajador de campo, como el sexo, acento, o comportamiento. Bajo ciertas circunstancias el hecho de que el trabajador de campo sea hombre o mujer influye en los resultados segn el tema que se est investigando. En las entrevistas por telfono puede influenciar mucho el acento, muchas veces las personas tienen prejuicios de acentos de ciertas regiones, se tienen que considerar todos lo factores.
7

Malentendidos
En este tipo de error ocurre cuando el personal de campo, cree que comprende bien como administrar la investigacin, pero en realidad lo hace incorrectamente. El cuestionario puede incluir instrucciones, diferentes tipos de escala, instrucciones de cmo registrar las respuestas de los entrevistados y otros procedimientos que deben ser comprendidos. Existe una diferencia en educacin muy considerable entre los diseadores de la investigacin y el personal de campo, y esta diferencia puede reflejarse en una problema de comunicacin.
8

Fatiga
El tercer error no intencional es referente a la fatiga, esto se da cuando el personal de campo ya se encuentra cansado. El trabajo de campo puede ser muy repetitivo y montono, por lo cual la gente se fatiga. Al final de un largo da de entrevistas, el personal de campo puede estar menos alerta y descuidar aspectos de la investigacin. Puede descuidar patrones de respuesta, como saltar una pregunta en caso de cierta respuesta, o profundizar ms en algunas preguntas, o hacerlo ms rpido y con menos detalle por la prisa de terminar.
9
Errores de los entrevistados Intencionales

Respuestas falsas
Este tipo de error ocurre cuando el entrevistado no proporciona informacin veraz, ya sea por proteger su intimidad o por vergenza. Existen ciertos temas que son ms propensos que otros a recibir respuestas falsas, como por ejemplo, el ingreso que recibe una persona, la edad, o cuestiones de higiene personal.
10
Errores de los entrevistados Intencionales

No respuesta
Este es el error intencional que ms se da en una investigacin, y es cuando los entrevistados no proporcionan respuesta a un reactivo determinado. Las negativas a participar en una investigacin son problemas que el investigador debe enfrentar. En una investigacin por telfono, por ejemplo, es muy comn este problema.
Errores de los entrevistados No-Intencionales

Malentendidos
Es cuando el entrevistado proporciona una respuesta sin comprender la pregunta planteada o el contexto. Por ejemplo, en una investigacin donde se requieren cantidades despus de impuestos, una persona puede estar respondiendo en trminos brutos, no netos.
11
12

Supuestos
Es cuando el entrevistado proporciona una respuesta de la cual no est seguro de su veracidad y est haciendo un supuesto de la informacin. Por ejemplo, en una pregunta como: Cunto fue el consumo en su hogar de agua el mes pasado en litros? Muchas personas podran suponer la cantidad que se le est preguntando, en lugar de ver el recibo de agua y dar el dato verdico.
13

Prdida de atencin
Es cuando el inters del entrevistado decae; entrevistado no est interesado en la investigacin como est el investigador, por lo que conforme avance cuestionario o entrevista cada vez se pierde ms y ms inters. el lo el el
14

Distracciones
Es cuando ocurren distracciones o interrupciones durante la entrevista. Por ejemplo, puede ser que al entrevistar a una madre de familia por telfono la interrumpa el beb o alguno de sus hijos. En el caso de una encuesta en un centro comercial puede ser que el entrevistado salude a algn conocido o familiar.

Fatiga
Es cuando el entrevistado se cansa de participar en la investigacin. Cuando esto sucede, las respuestas que se proporcionan ya no son reflexionadas. Por ejemplo, puede ser que en un cuestionario la persona tienda ms a seleccionar la categora de NR, no respuesta, a fin de terminar pronto.
15
16
Bibliografa
Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5). Burns, Alvin. Marketing Research. Estados Unidos: Editorial Prentice Hall 2000, (ISBN 0-13-014411-8).
Crditos:
17
18
Estrategias de control en la recoleccin de datos de campo

Como hemos visto, a pesar de que existen muchos factores de error en la recoleccin de datos de campo, afortunadamente existen tambin estrategias de control que podemos utilizar para minimizar estos errores. Cabe mencionar que no se eliminan en su totalidad, slo podemos disminuir su efecto. Las estrategias de control se resumen en la siguiente tabla:
1 2

Sesin 9. Cmo minimizar los errores en la recoleccin de datos de campo
Cmo controlar (minimizar) los errores

Tipos de error
Errores del trabajador de campo Errores intencionales Errores no-intencionales Error de los entrevistados Errores intencionales
Respuestas falsas Asegurar anonimato y confidencialidad Incentivos Chequeos de validacin Tcnica de la tercera persona Asegurar anonimato y confidencialidad Incentivos Tcnica de la tercera persona Cuestionario bien redactado Preguntas directas Cuestionario bien redactado Opciones de respuesta (respuestas cerradas) Escalas de diferencial semntico Utilizar apuntadores de avance (frases de nimo) Fraude Guiar a una respuesta Supervisin Validacin
Mecanismos de control
Estrategias de control para evitar errores del trabajador de campo Intencionales

Existen dos estrategias que se pueden utilizar para evitar los errores intencionales por parte del trabajador de campo: Supervisin Validacin
Caractersticas del entrevistador Malentendidos Fatiga
Seleccin y entrenamiento de los entrevistadores Sesiones de orientacin y simulacin de roles Descansos e investigaciones alternas
No respuesta
Malentendidos Adivinar respuestas Prdida de atencin Distracciones Fatiga
Supervisin Validacin
En la supervisin se utiliza una persona para vigilar el trabajo de campo. Por ejemplo, en las entrevistas telefnicas se les escucha o graba para ver si el entrevistador no est sesgando las preguntas o si est entrevistando a las personas de la muestra. En el caso de las entrevistas personales el supervisor puede ir de observador para evaluar el procedimiento.
En la validacin se verifica que el trabajador de campo haya hecho el trabajo requerido. Hay varias formas de hacer esto, por ejemplo, en una encuesta, se contacta nuevamente a la persona para ver si efectivamente particip en la investigacin.
Estrategias de control para evitar errores del trabajador de campo No-Intencionales

El nmero estndar que se debe validar es el 10% de la muestra. Tambin es conveniente realizar algunas preguntas nuevamente para comparar los resultados. Otra forma de validar, es que una persona con experiencia en el campo observe los cuestionarios y detecte si hay algn patrn inconsistente de respuestas; como en el caso de personas muy jvenes y una gran nmero de hijos, etc. Existen tres mecanismos de control para controlar los errores de campo no-intencionales: Sesiones de orientacin Simulacin de roles Descansos
Sesiones de orientacin
Simulacin de roles
Son reuniones en las cuales se orienta a los trabajadores de campo respecto al cuestionario y se les explican los procedimientos de administracin. En estas sesiones se debe ser claro respecto a los patrones de salto de respuestas, alguna instruccin especial o el formato de aplicacin del cuestionario.
La simulacin de roles tiene el propsito de que el entrevistador se familiarice con el cuestionario y se le oriente de manera prctica cmo resolver algn problema en la administracin del mismo. Se trata de actuar como si fuera una entrevista real, pero haciendo alusin a todos los requisitos de la investigacin.
10
Descansos
Con los descansos se pretende evitar la fatiga en los entrevistadores y evitar errores por esta cuestin. Es importante ser firmes en los descansos designados, an y que el trabajador de campo no los crea necesarios. En caso de tener varias investigaciones al mismo tiempo, se puede alternar a los trabajadores, para evitar que se fatiguen con la monotona de un mismo estudio.
Estrategias de control para evitar errores de los entrevistados Intencionales

Para controlar este tipo de errores, que son informacin falsa o falta de respuesta, es importante ofrecer confidencialidad de la informacin proporcionada por el entrevistado, y anonimato, que su nombre no pueda ser asociado con la informacin proporcionada. Otra estrategia es ofrecer incentivos, ya sea econmicos, regalos, o algn tipo de recompensa, como cupones, descuentos, etc. De esta forma el entrevistado se sentir ms comprometido a decir la verdad ya que est siendo remunerado por su participacin.
12
11
Tambin se puede utilizar validacin de pruebas, segn el caso, para reducir el error, por ejemplo, si el entrevistado responde que utiliza cierto tipo de vitaminas, pedirle que muestre el frasco. Si la persona dice tener cierta edad, pedirle una identificacin, si queremos el domicilio o colonia, pedirle un comprobante, etc.
Por ltimo, podemos utilizar la tcnica de la tercera persona, esto es preguntar al entrevistado en trminos de alguien ms, sobre todo en temas que pueden ser vergonzosos para algunos. Por ejemplo, Piensa usted que alguna persona de su misma edad y condicin fsica podra utilizar medicamentos tomados para evitar la calvicie?
13
14
Estrategias de control para evitar errores de los entrevistados No-intencionales

Para controlar este tipo de errores, que son Malentendidos, Adivinar respuestas, Prdida de atencin, Distracciones y Fatiga, es importante ofrecer cuidar el diseo de un cuestionario, se deben ofrecer ejemplos en caso necesario, cuando hay opciones de respuesta, ofrecer alternativas como Indiferente, Sin respuesta, Respuesta dudosa; ya que esto evita que las personas hagan supuestos de la informacin y adivinen las respuestas.
Estrategias de control para evitar errores de los entrevistados No-intencionales

Otra tctica es utilizar escalas de diferencial semntico, y no cargar las respuestas afirmativas o negativas de un solo lado. Por ltimo, en cuestionarios o entrevistas muy largas, es recomendable utilizar apuntadores de avance, o frases de nimo, como: Acabamos de terminar la parte ms complicada de la investigacin, Ya estamos por terminar, etc.
15
16
Ajuste de resultados para reducir el error de no- respuesta

El error de no-respuesta por parte del entrevistado, es de lo ms comn, por lo cual siempre debe ser cuantificado, y si el grado se considera un problema, se deben realizar ajustes; si este factor no es significativo, entonces no existe una razn para hacer ajustes. En el caso de necesitar ajustes, existen dos mtodos de compensacin: Promedios ponderados Sobremuestreo
17
Bibliografa
Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5). Burns, Alvin. Marketing Research. Estados Unidos: Editorial Prentice Hall 2000, (ISBN 0-13-014411-8).
18
Crditos:
19
1. Validacin y edicin
2. Codificacin

Sesin 10. Procesamiento de datos
3. Introduccin de datos
4. Limpieza de los datos
5. Tabulacin y anlisis
1 2
1. Validacin y edicin
La validacin se refiere al proceso de verificar que las entrevistas se hayan realizado de acuerdo a las indicaciones establecidas. Se verifican tanto los errores intencionales como los intencionales por parte del entrevistador y el entrevistado. Sobre todo las omisiones, si se siguieron los patrones de salto, etc. Es muy tedioso este proceso, puesto que a veces son miles de pginas por verificar, pero es algo que se debe realizar para garantizar la calidad de los resultados.
2. Codificacin
Se refiere al proceso de agrupar y asignar cdigos numricos a las posibles respuestas de una pregunta dentro de un cuestionario o entrevista. En muchos cuestionarios las respuestas ya estn precodificadas. Lo ms recomendable en estudios grandes es tener precodificada la mayor parte de la informacin.
Ejemplo de una encuesta pre-codificada
Procedimiento para codificacin de datos general
Revisar respuestas a preguntas cerradas
Asignar claves a preguntas cerradas Iniciar captura
Definir claves para cada pregunta cerrada del cuestionario vaco.
Integrar el catlogo de claves Revisar respuestas a preguntas abiertas Integrar por separado claves para preguntas abiertas Asignar claves a preguntas abiertas
Proceso de codificacin para respuestas abiertas Ejemplo de libro de cdigos

1. Realizar un listado de respuestas. Esto es en el caso de preguntas abiertas, donde se tiene que ver las respuestas que se van dando y agrupar las que se repiten, es como realizar un catlogo, se listan las que van saliendo nuevas y si se repiten se aaden al conteo de las respuestas registradas. 2. Consolidar las respuestas. Varias respuestas se pueden agrupar en una misma categora, pero esto lo tiene que decidir un investigador calificado y muchas veces se decide tambin con el cliente.
Ejemplo de respuestas a pregunta abierta codificada:

Por qu le gusta tomar Coca-Cola?
3. Determinar los cdigos. Se asigna el cdigo numrico a cada respuesta final. 4. Introducir los cdigos.
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.
Porque sabe bien Porque me gusta Por la publicidad Porque le gusta a mi esposo/a Es la que ms se vende Es la que siempre encuentro a la mano Porque te la traen a domicilio Estoy acostumbrado Es un hbito Es la que beben todos mis amigos Porque est en oferta Tena promocin Por inercia La bebo desde que era nio Me ayuda con el dolor estmago Me reanima cuando me siento mal No hay ninguna razn en particular No s No tengo idea
10
3. Introduccin de datos
Es el proceso de convertir la datos a un formato electrnico, y nos sirve para poder procesarlos y obtener informacin relevante del estudio para la toma de decisiones. Este proceso requiere de un dispositivo para la introduccin de datos, como una computadora y un medio de almacenamiento, como cd, disco duro, etc.
Generalmente los datos se introducen en un paquete estadstico, como SPSS (ejemplo de pantalla), SAS, Minitab, Excel, por mencionar algunos. El ms utilizado en el mercado de investigacin de mercados es el SPSS.
11
12
4. Limpieza de datos
En esta parte ya se han introducido los datos a la computadora y es el momento de realizar una verificacin final de errores antes de continuar con el anlisis estadstico. Se utilizan tcnicas que en principio son para clculo estadstico pero que nos dan pistas de los posibles problemas.
Podemos controlar varios aspectos en los datos: Valores perdidos Casos repetidos Valores imposibles: Sexo varn, dos embarazos Valores implausibles: Altura 1.60 mts, peso 100 kilos Los valores imposibles deben ser corregidos, los valores implausibles pueden ser valores legtimos y necesitan ser investigados con detalle.
13
14
Existen comprobaciones generales en la hoja de clculo: Lneas repetidas (SPSS 12 tiene un comando para esto) Casillas en blanco Valores repetidos Utilizando tcnicas estadsticas. Estas tcnicas son diferentes para variables categricas o numricas y tambin nos permiten ver si hay errores de captura.
Categricas Frecuencias para una variable Cruces de Frecuencias para ms de una variable Numricas Mximos y mnimos para variables numricas. Tambin histogramas
15
16
Diagramas de dispersin para dos variables
5. Tabulacin y anlisis estadstico

Ya que los datos han sido introducidos a la computadora y estn libres de errores de captura, estn listos para tabularse y realizar anlisis estadsticos. Las tres grandes ramas de tipos de anlisis que estaremos viendo en los siguientes mdulos son:
17
18
Bibliografa
Inicio
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5).
Ms de dos
Una
Cuntas variables van a utilizarse a la vez? Dos
Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).
Anlisis univariado de datos
Anlisis bivariado de datos
Anlisis Multivariado de datos
19
20
Crditos:
21
Anlisis de Datos
PROCESO DE PREPARACION DE DATOS
Revisin del Cuestionario Edicin Codificacin Transcripcin Depuracin de datos Ajuste estadstico Estrategia de Anlisis
1 2

Sesin 11. Anlisis univariado de datos: Estadstica descriptiva
Estrategia de Anlisis
Nmero de variables a analizar simultneamente Univariado, Bivariado o Multivariado Propiedades de las tcnicas estadsticas Descriptivas o Inferenciales Conocer caractersticas de los datos Escalas de medicin de acuerdo al tipo de datos Consideraciones durante el proceso de investigacin Definicin del problema, mtodo y diseo Antecedentes y filosofa del investigador
3
Cuntas variables se analizarn simultneamente ?

1 2 Ms de 2
Univariado
Bivariado
Se enfoca en:
Multivariado
Niveles (promedio) Distribucin (desviacin)
Grado de relaciones (correlaciones y covarianzas)
Anlisis univariado
Es el anlisis de una variable de manera individual. Se utiliza cuando hay una medida nica de cada elemento de la muestra o en caso de tener dos o ms mediciones de los elementos cada variable se analiza por separado. Los datos pueden analizarse solos o agrupados categoras o clases (frecuencias). en
Tipos de Anlisis de Datos Univariados

Propiedades Tcnicas Estadsticas Descriptiva. Estadsticas que proporciona medidas
resumidas de los datos en sus muestras. Tales como: Medidas de Tendencia Central y Dispersin Inferencial. Estadsticas que permiten hacer juicios acerca de la poblacin total basado en resultados generados por las muestras. Tales como: Pruebas z, t y ji cuadrada
6
Procedimientos univariados
Las estadsticas que se utilizan para analizar los datos univariados van de acuerdo a la escala y el tipo de informacin que queremos obtener: Medida de Tendencia Central Moda Mediana Media
Medidas de tendencia central: media

Es la suma de los valores dividido por el tamao de la muestra. Es lo que se conoce como "promedio". Se usa con datos de intervalos
Escala Nominal Ordinal Intervalo
Medida de Dispersin Frecuencias Rango intercuartil Desviacin estandar

7
Ejemplo: Valores: 12,16,15,11 y 9 = 63/5 = 12.6
Tambin se puede utilizar cuando los datos de intervalo se agrupan en categoras o clases (frecuencias).
Categora/Edad 25 a 30 aos 30 a 35 aos 35 a 40 aos Mas de 40 Totales No. de personas fi 8 16 24 16 64 Punto medio Xi 14 18 22 26 fiXi 112 288 528 416 1,344
Medidas de Tendencia Central: Mediana

Es el valor medio cuando los datos se agrupan en orden de magnitud. Se utiliza con los datos de escala ordinal o de intervalo.
Observacin X1 X2 X3 X4 X5
Valor de Xi 15 26 Mediana 71 84 102
= 1,344 / 64 = 21
9
Los datos se ordenan de manera creciente o decreciente.

10
Medidas de Tendencia Central: Moda

Es la categora de una variable nominal que ocurre con mayor frecuencia. Se utiliza con datos de escalas nominales o de orden superior. Categora/ Edad 25 a 30 aos 30 a 35 aos 35 a 40 aos Mas de 40 Totales Numero de personas fi 8 16 24 16 64
11
Medidas de dispersin: Desviacin Estndar

Indica cunto tienden a alejarse los valores puntuales del promedio. Se utiliza con datos de Intervalo. Una desviacin estndar grande indica que los puntos estn lejos de la media y una desviacin pequea indica que los datos estn agrupados cerca de la media. Se representa con: S o con la letra sigma
MODA
12
Datos: 20,36,30,24,6,12,10,14 1) Determinar la media = 19 2) Raz Cuadrada de los cuadrados de las desviaciones de los datos de la media (x- X)2
(20-19)^2= (36-19)^2= (30-19)^2= (24-19)^2= (6-19)^2= (12-19)^2= Total 1 289 121 25 169 49 654
Medidas de dispersin: Frecuencias

La frecuencia es la repeticin de un proceso. La distribucin de frecuencias es hacer un conteo del numero de respuestas asociadas con diferentes valores de la variable. Se utilizan en Datos de Escala Nominal. Pueden ser: Absolutas. Son los nmeros de la muestra que aparecen en cada categora de la variable nominal.
3) S= Raz cuadrada de 654/8 4) S= 25.57

13
Relativas. Son los porcentajes de los elementos totales que aparecen en cada categora.
14
Medidas de dispersin: Frecuencias

Ejemplo. Cuntas veces por semana consume leche?
xi 0 1 2 3 4 5 6 7 f absoluta 8 18 25 20 6 8 4 1 n = 90 F relativa 8.88% 20% 27.7% 22.2 6% 8% 4% 1% 100% f absoluta / n
Qu hemos aprendido?
Debemos elegir una tcnica estadstica en funcin a: El nmero de variables a analizar simultneamente (anlisis UNIVARIADO, bivariado y multivariado). Tipo de informacin estadstica deseada: DESCRIPTIVA (descripcin de la muestra) e Inferencial. En el anlisis univariado Descriptivo utilizamos medidas de TENDENCIA CENTRAL y de DISPERSION , y para determinar cuales estadsticos debemos conocer el tipo de ESCALA de los datos (intervalo, ordinal o nominal).
15 16
Bibliografa
Crditos:
17
18
Anlisis Univariado Inferencial

Como vimos en la sesin anterior, de acuerdo al tipo de informacin, podemos dividir la estadstica en dos categoras, la estadstica descriptiva e inferencial. Estadstica Inferencial nos permite hacer juicios acerca de la poblacin total basado en resultados generados por las muestras. Ejemplo. Para estimar el consumo de leche en Monterrey, una muestra aleatoria puede someterse a investigacin Con base en estos resultados muestrales puede estimarse el consumo de la poblacin.
1 2

Sesin 12. Anlisis Univariado Inferencial: Prueba de Hiptesis
Prueba de Hiptesis
Con frecuencia no es suficiente describir lo que aparece en la muestra, sino se requiere hacer inferencias de la muestra con respecto a la poblacin de la cual se tom. Para hacer un anlisis inferencial, debemos conocer las Pruebas de Hiptesis. Prueba de Hiptesis: Procedimiento basado en la evidencia muestral y la probabilidad. Es una aseveracin de una poblacin con el propsito de verificar si la afirmacin es razonable en funcin a los datos de la muestra.
3
Pasos Prueba de Hiptesis

1.Formular hiptesis nula y alternativa 2.Elegir la estadstica de prueba 3.Determinar Nivel de significancia 4.Calcular la estadstica de prueba 5.Determinar la probabilidad: valor critico 6.Comparar valor critico y tomar decisin
No se rechaza HO
Se rechaza HO
1. Formular Hiptesis
Hiptesis Nula ( H0 ) Enunciado del estado en que se encuentran las cosas y en el que no se espera ninguna diferencia ni efecto, es decir, supone que un parmetro de poblacin adquiere determinado valor o conjunto de valores. La hiptesis nula es la que siempre se pone a prueba. Alternativa ( H1 ) Enunciado en el que se espera alguna diferencia o efecto (opuesto a la hiptesis nula).
5
1. Formular Hiptesis
Las pruebas pueden ser bilateral o de 2 colas o unilateral, una cola, en caso de tener una direccin (> o <).
2. Elegir la Estadstica de Prueba

La estadstica de prueba mide la aproximacin de la muestra a la hiptesis nula. La prueba apropiada de inferencias estadsticas vara segn el nivel de ESCALA de los Datos. Datos de Intervalo (hipotesis de ) Prueba z Prueba t Datos nominales (hipotesis de ) Prueba ji cuadrada
7

Datos de Intervalo
La prueba z y la prueba t, son pruebas sobre el tamao de la media de la poblacin. La seleccin entre las dos depende del conocimiento que tiene el investigador sobre la desviacin estndar y el tamao de la muestra utilizado.

Datos de Intervalo
Prueba z es adecuada cuando: 1)El tamao de la muestra es de cualquier orden y se conoce la desviacin estndar de la poblacin, o 2) El tamao de la muestra es mayor que 30 y no se conoce la desviacin estndar. Prueba t es adecuada cuando: 1) La n < 30 y no se conoce la desviacin estndar.
9

Datos Nominales
Prueba ji cuadrada Compara una distribucin hipottica de la poblacin con una distribucin generada por la muestra.
10
3. Nivel de Significancia ()
Es la probabilidad de rechazar la hiptesis nula cuando esta es realmente cierta . Se pueden cometer dos clases de errores: Error tipo I (). Es rechazar la hiptesis nula cuando sta es realmente cierta. Error tipo II () Es no rechazar la hiptesis nula cuando sta es realmente falsa. (proporcin)
11
3. Nivel de Significancia ()
Potencia de la prueba (1-) Es el complemento de la probabilidad de un error tipo II. El nivel de significancia () se escoge de acuerdo al riesgo de rechazar equivocadamente la H0 que se dese. Los niveles ms usados son .10, .05 y .01
12
4. Calcular Estadstico de Prueba

Parmetro en Ho una poblacin
5. Determinar Probabilidad: Valor crtico

Valor crtico. Valor que define dnde comienza la regin crtica. Regin crtica. Es el conjunto de valores del estadstico de prueba para los que se rechaza H0. La regin crtica depende del tipo de hiptesis (una o dos colas), la distribucin de probabilidad y el nivel de significancia. El valor crtico se determina usando el nivel de significancia, una vez que se haya determinado dnde se encuentra la regin crtica. (Tablas z y t para hiptesis de medias y de ji cudrada para hiptesis de desviacin)
13 14
Informacin
Distribucin
Estadstico de prueba
Normal Z n>30 Normal z n<30 Prueba t
S* Poblacin normal
Poblacin normal
Ji cuadrada
* La s es un estimado de la desviacin estndar, ya que no se conoce. Existen frmulas para calcular las pruebas si se tienen proporciones.
6. Comparar valor crtico y Tomar una decisin

Para tomar una decisin debemos comparar los valores crticos con el valor del estadstico de prueba. Si este ltimo cae dentro de la regin crtica entonces rechazamos H0 De lo contrario decimos que no hay suficiente evidencia para rechazar H0
Ejemplo: Prueba de Hiptesis

Sabritas quiere probar si en su nueva promocin tiene 20 ms ganadores por da. Un ejecutivo de la empresa asegura que se estn sobreestimando el nmero de ganadores, por lo que decide escoger una muestra de 45 bolsas de papitas y probar con un nivel de significancia de .05. De la muestra se obtuvo una media de 16 y una desviacin estndar de 10. Determinar la distribucin de
Formular la hiptesis: probabilidad y la regin crtica:
H0: 20 H1: < 20

Valor crtico Se obtuvo de la tabla Z
- 1.64
15
16
Ejemplo: Prueba de Hiptesis

Calcular el estadstico de prueba:
Ejemplo: Prueba de Hiptesis 2

La nueva presentacin de Pepsi contiene 12 oz de refresco, para el director de calidad no slo es importante que el promedio de oz est cerca de 12, sino tambin que la varianza no sea mayor de .200 oz2 Se seleccion una muestra de 101 latas con un nivel de significancia de .05, dando una media de 11.75 oz y 2= .245oz2
Formular la hiptesis:
Z
-1.64
Tomar una decisin: Como cae en la regin crtica rechazamos H0, lo cual quiere decir que el ejecutivo tiene razn, se esta sobreestimando el nmero de ganadores por da.
17
H0: 2 .200 H1: 2 > .200
Determinar la distribucin de probabilidad y la regin critica:
18
Ejemplo: Prueba de Hiptesis 2

Calcular el estadstico de prueba:
Anlisis Inferencial
Lo que hemos aprendido hasta ahora El anlisis inferencial nos permite hacer supuestos de una poblacin con los datos obtenidos de una muestra. Para realizar este anlisis debemos aplicar la prueba de hiptesis. Los pasos de la prueba de hiptesis son: 1. Formular la hiptesis (nula y alternativa) 2. Seleccionar el estadstico de prueba en funcin a: a) Tipo de escala b) La informacin que tenemos de la muestra y desviacin estndar para hiptesis de
20
Tomar una decisin: Como el valor crtico no cae en la regin, no hay suficiente evidencia para decir que la varianza es mayor a .200 por lo tanto se acepta H0.
19
Anlisis Inferencial
3. 4. 4. 5. 6. Determinar el nivel de significancia . Considerar los tipos de error I y II. Calcular el estadstico de prueba. Determinar la probabilidad (valor crtico). Considerar una cola o dos colas, se utilizan tablas para determinar la regin crtica con valores de z, t y jicuadrada. 7. Comparar Valor Crtico y tomar una decisin.
Bibliografa
21
22
Crditos:
23
Tablas cruzadas o tablas de contingencia

El objetivo de la tabulacin cruzada es identificar la relacin que existe entre dos variables.

Sesin 13. Anlisis bivariado: tablas cruzadas
Con los datos de una muestra podemos observar si existe alguna relacin entre dos variables, y la pregunta que surge naturalmente es si esta relacin es verdadera o es el resultado del error muestral. Las tablas de contingencia son tabulaciones cruzadas entre dos variables X e Y con r y c categoras respectivamente. Es decir, que la tabla de contingencia entre X e Y tendr r filas y c columnas.
1 2
Los datos se organizan en una tabla de doble entrada, llamada Tabla de contingencia, cuya forma general es la siguiente:
VAR B1 VAR A A1 A2 A3 Ar Total Or1 C1 Or2 C2 Or3 C3 O11 O21 O31 B2 O12 O22 O32 B3 O13 O23 O33 B Bc O1c O2c O3c Orc Cc Rr n Total R1 R2 R3
Tablas cruzadas o tablas de contingencia

Oij es el nmero de sujetos caractersticas Ai y Bj a la vez. que tienen las
Ri (i = 1,,r) es la suma de la i-sima fila de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Bi. Cj (j = 1,,c) es la suma de la j-sima columna de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Ai. n representa el total de observaciones tomadas.
4
Tablas de Contingencia y Medidas de Asociacin

Existir o no relacin entre las variables A y B?, es decir si A y B son o no independientes. A y B sern independientes si cada entrada de la tabla es igual al producto de los totales marginales dividido entre el nmero de datos. Esto es si cumple, Se utiliza un test de hiptesis conocido como el test Chicuadrado de Pearson. La hiptesis nula del test es que las dos variables analizadas son independientes. La hiptesis alternativa es que las variables no son independientes, es decir, que existe una relacin entre las dos variables. Ilustremos el test utilizando un ejemplo. La siguiente tabla de contingencia muestra la tabulacin cruzada de la variable ingreso anual (dividido en tres categoras) y la ltima marca de coche comprada (dividida en tres marcas).
6
Oij =
Ri C j n

Marca del ltimo auto comprado Ford Toyota Renault Ingreso anual Menos de 20,000 20,000 - 40,000 ms de 40,000 Total 50 200 100 350 200 100 25 325 125 350 50 525 375 650 175 1200

Las entradas de la tabla representan el nmero de personas en la muestra con cada combinacin de ingreso y marca de auto. Por ejemplo, 50 personas que ganan menos de 20,000 $ compraron un auto marca Ford. El test Chi-cuadrado de Pearson se basa en encontrar cul hubiera sido el valor de cada entrada si las variables fueran independientes. Es decir, el valor esperado de cada celda de la tabla si las variables ingreso y marca son independientes.
Total
Si ingreso y marca son independientes, la probabilidad del evento conjunto "A1: ganar menos de $20,000" y "B1: comprar marca Ford" es el producto de esas dos probabilidades: Pr(A1 y B1) = Pr(A1)*Pr(B1) Pr(A1) = A1/A = 375/1200, Pr(B1) = B1/B = 350/1200 Donde A y B son las frecuencias totales de los eventos.
Por lo tanto: Pr(A1 y B1) = Pr(A1)*Pr(B1) = 375*350/(1200*1200) = 0.091 El nmero esperado en la entrada A1B1 es entonces: N* Pr(A1 y B1) = 1200*0.091 = 109.38
10

En general la frmula del valor esperado es: Eij = (NAi*NBj)/N. Eij = nmero esperado NAi= nmero de elementos en la categora Ai NBi= nmero de elementos en la categora Bi Para A1B1 el nmero esperado es: E11 = (375*350)/1200 = 109.38
11
Este proceso se puede repetir para cada una de las entradas de la tabla. Una vez hecho esto el estadstico Chi-cuadrado se calcula con la siguiente frmula:
E ij i =1 j =1 r = nmero de categoras de la variable en las filas c = nmero de categoras de la variable en las columnas Oij = nmero observado en entrada ij Eij = nmero esperado en la entrada ij
Este estadstico Chi-cuadrado tiene (r-1)*(c-1) grados de libertad.
12
2 =
r c
(Oij E ij )2

En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad. Realizando todas las cuentas con la tabla del ejemplo, el estadstico da 252.2. Comparando este nmero con el valor crtico de la distribucin Chi-cuadrado con 4 grados de libertad a un nivel de significatividad del 5% el valor crtico correspondiente es 9.49. Como 252.2 > 9.49 se rechaza la hiptesis nula. Es decir, las variables no son independientes. El estadstico de Pearson nos dice si dos variables son independientes una de otra pero no nos dice nada acerca de la naturaleza de la relacin. Cuando analizamos variables dicotmicas (adoptan solo los valores 0, 1) el estadstico de Pearson puede ser poco preciso. En esos casos se suelen utilizar otras medidas de asociacin.
13
14
Medidas de Asociacin para Tablas de 2x2

El Coeficiente Phi () Es una medida del grado de asociacin entre dos variables dicotmicas basada en el estadstico Chicuadrado de Pearson. Este coeficiente toma valores en el intervalo cero-uno. Valores prximos a cero indican poca asociacin entre las variables y valores cercanos a uno indican una fuerte asociacin. El coeficiente puede ser calculado como el coeficiente de correlacin entre dos variables dicotmicas. Alternativamente, puede ser calculado utilizando el estadstico Chi-cuadrado de Pearson con la siguiente frmula: = (2/N)1/2 donde N es el nmero de datos.
15
16
Riesgo Relativo El riesgo relativo es una medida del grado de asociacin entre dos variables dicotmicas, que compara el producto de las frecuencias en la diagonal principal de la tabla con el producto de las frecuencias en la diagonal opuesta mediante el cociente entre ambos. En consecuencia toma valores positivos y, si las variables son independientes, su valor ser prximo a uno.
El coeficiente de contingencia El coeficiente de contingencia es una extensin del coeficiente al caso de que al menos una de las variables presente ms de dos categoras. Toma valores entre 0 y Cmax, donde si r y c son el nmero de categoras de cada una de las variables: Cmax = [min(r-1,c-1)/(1+ min(r-1,c-1))]1/2
17
18
Medidas de Asociacin para Tablas Mayores a 2x2

Valores del coeficiente de Contingencia cercanos a 0 indican que no hay asociacin entre las variables y valores prximos a Cmax indican una fuerte asociacin (note que Cmax es un nmero que siempre ser menor a uno).
Medidas de Asociacin para Tablas Mayores a 2x2

La V de Cramer Otra extensin del coeficiente al caso de variables con ms de dos categoras es la V de Cramer que, a diferencia del coeficiente de contingencia toma valores entre 0 y 1. Valores de V cercanos a 0 indican que no hay asociacin entre las variables y valores cercanos a 1 indican una fuerte asociacin. V = (2/(r c)*N)1/2
19 20
Bibliografa
Crditos:
21
22
Anlisis bivariado
Son los mtodos estadsticos para analizar la relacin entre dos variables de estudio. Se conocen como tcnicas bivariadas. Cuando se analiza el grado de asociacin entre dos variables, debe de existir una variable independiente, que es el factor de prediccin, y una variable independiente, que es el criterio.

Sesin 14. Anlisis bivariado: correlacin
Procedimientos bivariados
Las variables independientes son aquellas que se cree afectan el valor de la variable dependiente. Por ejemplo, variables independientes tales como precio, distribucin, gasto en promocin, etc., se pueden utilizar para describir el tipo de relacin y predecir su comportamiento, en variables dependientes como ventas o participacin de mercado de un producto.
Dos variables de intervalo
Cul es el nivel de escala de las variables?

Dos variables ordinales
Dos variables nominales
Coeficiente de correlacional lineal r Regresin simple
Coeficiente de correlacin por rangos Gamma Tao
Coeficiente de contingencia Lambda
Prueba t sobre el coeficiente de regresin Prueba z sobre la diferencia entre medias Prueba t sobre la diferencia entre medias
Prueba U de Mann Whitney Prueba de Kolmogorov Smirnov
Prueba de ji cuadrado
Anlisis bivariado
CORRELACIN: Con esta tcnica trataremos de dar respuesta a si existe dependencia entre dos variables. Si son independientes, no se sigue estudiando. Si existe dependencia, nos plantearemos el grado de dependencia. REGRESIN: Con esta tcnica trataremos de determinar el tipo de dependencia. Si son dependientes intentaremos determinar la variable dependiente a partir de la variable independiente. Y = Variable dependiente o variable respuesta. X = Variable independiente o regresora.
5
Correlacin y regresin
VARIABLES CUALITATIVAS VARIABLES CUANTITATIVAS Estudio de independencia
Dos variables son independientes cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales
fi. * f.j = fij

Si son independientes ya no seguimos estudiando la relacin porque no existe.
2.Estudio del grado de relacin Grado de asociacin

1.- Coeficiente de asociacin (H) 2.- otros estadsticos (ro de Spearman, tau de kendall) 3.- Test de la X2 (Lo veremos al ver la inferencia)
Correlacin
1.- Grficamente. 2.-Analticamente: Covarianza. Coeficiente de correlacin de Pearson.
3. Regresin
partir de la ind.)
(estimar los valores de la vble. dep. a
Relacin lineal. Relacin no lineal

(no la veremos)
Introduccin: un poco de historia

El trmino regresin fue introducido por Galton en su libro Natural inheritance (1889) refirindose a la ley de la regresin universal: Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor. Regresin a la media Su trabajo se centraba en la descripcin de los rasgos fsicos de los descendientes (una variable) a partir de los de sus padres (otra variable).
Pearson (un amigo suyo) realiz un estudio con ms de 1000 registros de grupos familiares observando una relacin del tipo: Altura del hijo = 85cm + 0,5 altura del padre (aprox.) Conclusin: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos. Hoy en da el sentido de regresin es el de prediccin de una medida basndonos en el conocimiento de otra.
Correlacin
A la derecha tenemos un ejemplo de los datos obtenidos observando dos variables en varios individuos de una muestra. En cada fila tenemos los datos de un individuo. Cada columna representa los valores que toma una variable sobre los mismos. Los individuos no se muestran en ningn orden particular. ANLISIS GRFICO: Dichas observaciones pueden ser representadas en un diagrama de dispersin (scatterplot). En ellos, cada individuos es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo ser intentar reconocer a partir del mismo si hay relacin entre las variables, de qu tipo, y si es posible predecir el valor de una de ellas en funcin de la otra.
Altura en cm.
162 154 180 158 171 169 166 176 163 ...
Peso en Kg.
61 60 78 62 66 60 54 84 68 ...
Altura en cm.
162 154 180 158 171 169 166 176 163 ...
Peso en Kg.
61 60 78 62 66 60 54 84 68 ...
10
Correlacin - Diagramas de dispersin

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersin.
100 90 80 70 60 50 40 30 140 150 160 170 180 190 200
11
Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersin.
100 90
Pesa 76 kg. Mide 187 cm.
80 70 60 50 40 30 140
Pesa 50 kg. Mide 161 cm.
au eso el p que ce are ura P lt la a
on ac ent m
150
160
170
180
190
200
12
Correlacin: Prediccin de una variable en funcin de la otra = Regresin

Aparentemente el peso aumenta 10 kg por cada 10 cm de altura... o sea, el peso aumenta en una unidad por cada unidad de altura.
100 90 80 70 60 50 40 30 140 150 160
Correlacin: Cmo reconocer relacin directa e inversa.

330 280 230 180 130 80 30 140
100
Incorrelacin
90 80 70 60 50 40 30
Fuerte relacin directa.
150
160
170
180
190
200
140
150
160
170
180
190
200
Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelacin.
Para los valores de X mayores que la media le corresponden valores de Y mayores tambin. Para los valores de X menores que la media le corresponden valores de Y menores tambin. Esto se llama relacin directa o creciente entre X e Y. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relacin inversa o decreciente.
10 kg.
80 70 60 50 40 30
10 cm.
170 180 190 200
13
Cierta relacin inversa
20 10 0 140 150 160 170 180 190 200
14
Correlacin: Covarianza de dos variables X y Y

La covarianza entre dos variables, Sxy, nos indica si la posible relacin entre dos variables es directa o inversa. Directa: Sxy >0 1 Inversa: Sxy <0 S xy = ( xi x )( yi y ) n i No-relacionda: Sxy =0
Correlacin: Covarianza de dos variables X y Y

La covarianza tiene el inconveniente de que no est delimitada, por tanto necesitamos un coeficiente o algn valor que venga definida la relacin entre dos variables para poder saber si la relacin es fuerte o dbil: COEFICIENTE DE CORRELACIN DE PEARSON
El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relacin entre las variables. Adems es una medida que depende de las unidades, por lo que permite comparar entre distribuciones.
15 16
Correlacin: Coeficiente de correlacin lineal de Pearson

La coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). Tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relacin sea directa o inversa. s til para determinar si hay relacin lineal entre dos variables, pero no servir para otro tipo de relaciones (cuadrtica, logartmica,...)

El coeficiente nos sirve para determinar si existe una relacin significativa o no a la asociacin en anlisis. Debemos identificar tres aspectos : 1. Grado de presencia : El valor de p, a la hora de calcular el coeficiente, debe ser examinado primero, ya que si la relacin es (>.05), siginifica que no existe relacin, si p=or<.05, significa que s existe una relacin significativa y procedemos a determinar:
r=
S xy
SxS y
17 18

2. Direccin de la asociacin: Hay que ver si el coeficiente es negativo (-) o positivo (+). 3. Fuerza de la asociacin: El coeficiente de correlacin (r) es un nmero que se encuentra en el rango 1.0 a +1.0. Entre ms cercano sea a 1.00 (+ -), mayor es la asociacin, a continuacin presentamos una clasificacin que ser til en este aspecto.

Despus de haber obtenido el coeficiente de correlacin y determinar si es estadsticamente significativo, podemos concluir acerca de la fuerza en la asociacin de variables. Si el coeficiente cae entre: +1 y +.81 -1 y -.81 +.80 y +.61 -.80 y -.61 +.60 y +.41 -.60 y -.41 +.21 y +.40 -.21 y -.40 Igual o menor a .20 Relacin Alta Relacin Moderada Relacin Baja Relacin Dbil Inexistente
20
19
Correlacin: Otros coeficientes de correlacin

Cuando las variables en vez de ser numricas son ordinales, es posible preguntarse si hay algn tipo de correlacin entre ellas. Para estos casos, disponemos de dos estadsticos: (ro) de Spearman (tau) de Kendall Son estadsticos anlogos a r y los podemos aplicar donde las variables no puedan considerarse numricas.
Bibliografa
21
22
Crditos:
23
Regresin
El anlisis de regresin no se debe confundir con el de correlacin, el que mide el grado de relacin lineal entre las variables, en cambio, el de regresin, mide relaciones de causalidad. El anlisis de correlacin supone que todas las variables son aleatorias, en cambio, cuando se regresiona, se supone que las variables explicativas son fijas en muestreos repetidos.

Sesin 15. Anlisis bivariado: regresin lineal simple
El anlisis de regresin sirve para predecir una medida en funcin de otra medida (o varias). Y = Variable dependiente predicha explicada X = Variable independiente predictora explicativa Es posible descubrir una relacin? Y = f(X) + error f es una funcin de un tipo determinado el error es aleatorio, pequeo, y no depende de X
Veremos un ejemplo del estudio de la altura en grupos familiares de Pearson, como la sesin anterior, que estaremos manejando durante el resto del tema. Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X) Si el padre mide 200cm cunto mide el hijo? Se espera (predice) 85 + 0,5x200=185 cm. Alto, pero no tanto como el padre. Regresa a la media.
Modelo de regresin lineal simple

En el modelo de regresin lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa) buscamos encontrar una funcin de X muy simple (lineal) que nos permita aproximar Y mediante = b0 + b1X b0 (ordenada en el origen, constante) b1 (pendiente de la recta) Y y rara vez coincidirn por muy bueno que sea el modelo de regresin. A la cantidad e=Y- se le denomina residuo o error residual.
Si el padre mide 120cm cunto mide el hijo? Se espera (predice) 85 + 0,5x120=145 cm. Bajo, pero no tanto como el padre. Regresa a la media. Es decir, nos interesaremos por modelos de regresin lineal simple.

Y y rara vez coincidirn por muy bueno que sea el modelo de regresin. A la cantidad e=Y- se le denomina residuo o error residual. En el ejemplo de Pearson y las alturas, l encontr: = b0 + b1X b0=85 cm (No interpretar como altura de un hijo cuyo padre mide 0 cm) b1=0,5 (En media el hijo gana 0,5 cm por cada cm del padre)
180 150 120 90 60 30 0
7 8
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220
b1=0,5
b0=85 cm
La relacin entre las variables no es exacta. Es natural preguntarse entonces: Cul es la mejor recta que sirve para predecir los valores de Y en funcin de los de X Qu error cometemos con dicha aproximacin (residual).

El modelo lineal de regresin se construye utilizando la tcnica de estimacin mnimo cuadrtica: Buscar b0, b1 de tal manera que se minimice la cantidad i ei2 Se comprueba que para lograr dicho resultado basta con elegir: S b1 = r Y b0 = y b1 x SX
180 150 120 90 60 30 0

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220
b1=0,5
b0=85 cm
9 10
Se obtiene adems unas ventajas de regalo El error residual medio es nulo. La varianza del error residual es mnima para dicha estimacin. Traducido: En trmino medio no nos equivocamos. Cualquier otra estimacin que no cometa error en trmino medio, si es de tipo lineal, ser peor por presentar mayor variabilidad con respecto al error medio (que es cero).

Que el error medio de las predicciones sea nulo no quiere decir que las predicciones sean buenas. Hay que encontrar un medio de expresar la bondad del ajuste (bondad de la prediccin)
No importa. Con los dos ltimos clientes me equivoqu en +10 y +20. En trmino medio el error es cero. Cometi un error de -30 en su ltima prediccin
11
12
Cmo medir la bondad de una regresin?

Imaginemos un diagrama de dispersin, y vamos a tratar de comprender en primer lugar, qu es el error residual, su relacin con la varianza de Y, y de ah, cmo medir la bondad de un ajuste.
13
Cmo medir la bondad de una regresin? Interpretacin de la variabilidad en Y

En primer lugar olvidemos que existe la variable X. Veamos cul es la variabilidad en el eje Y. La franja sombreada indica la zona donde varan los valores de Y. Proyeccin sobre el eje Y = olvidar X
Y
14
Cmo medir la bondad de una regresin?
Interpretacin del residuo

Y
Regresin: Bondad de un ajuste

Resumiendo: La dispersin del error residual ser una fraccin de la dispersin original de Y Cuanto menor sea la dispersin del error residual mejor ser el ajuste de regresin. Eso hace que definamos como medida de bondad de un ajuste de regresin, o coeficiente de determinacin a:
Y
Fijmonos ahora en los errores de prediccin (lneas verticales). Los proyectamos sobre el eje Y. Se observa que los errores de prediccin, residuos, estn menos dispersos que la variable Y original. Cuanto menos dispersos sean los residuos, mejor ser la bondad del ajuste.
R2 = 1
15
S e2 2 SY
2 Se2 < SY
16
Regresin: Bondad de un ajuste Resumen

La bondad de un ajuste de un modelo de regresin se mide usando el coeficiente de determinacin R2 R2 es una cantidad adimensional que slo puede tomar valores en [0, 1] Cuando un ajuste es bueno, R2 ser cercano a uno. Cuando un ajuste es malo R2 ser cercano a cero. A R2 tambin se le denomina porcentaje de variabilidad explicado por el modelo de regresin. R2 puede ser pesado de calcular en modelos de regresin general, pero en el modelo lineal simple, la expresin es de lo ms sencilla: R2=r2
17
18
Bibliografa
Crditos:
19
20
Universidad Tec Milenio: Profesional AM04003 Analisis e interpretacin de resultados
SPSS
El paquete estadstico SPSS (Statistical Package for the Social Sciences) es uno de los muchos que se pueden utilizar para la investigacin de mercados. Existen otros paquetes como SAS, Minitab e inclusive Excel que se pueden utilizar, sin embargo, el SPSS es el ms empleado actualmente para este rubro.

Sesin 16. SPSS
Regresin
SPSS esta estructurado en tres ventanas diferentes: Editor de datos de SPSS: es la primera ventana que aparece nada ms acceder al programa. Permite visualizar los datos y las variables con los que vamos a trabajar. Recoge todos los mens para trabajar con los datos y realizar los anlisis estadsticos. Editor de sintaxis de SPSS: en esta ventana podemos pegar la sintaxis generada al realizar un clculo, implementar un mtodo, dibujar un grfico, en general, al implementar cualquiera de las utilidades que nos ofrece SPSS. Visor de resultados de SPSS: en esta ventana podemos visualizar los resultados del mtodo implementado.
3
Introducir datos en SPSS Al abrir el programa SPSS lo primero se solicita es el archivo de trabajo. Se puede seleccionar una base de datos o bien pulsar en el botn Cancelar y acceder directamente a la ventana de Editor de datos del programa SPSS. En esta ventana se pueden entrar de forma manual los datos o bien cargar unos nuevos datos mediante la opcin Abrir Datos del men Archivo. El programa SPSS trabaja con los datos previamente grabados en un archivo al que denominamos archivo de datos y tiene la extensin obligatoria .sav
La ventana de Editor de datos de SPSS dispone de dos pestaas: Vista de datos y Vista de variables. - Vista de datos: est dividida en columnas y filas dando lugar a celdas o casillas donde se recogen los datos. Cada columna tiene asignado un nombre de variable, ya sea especificado por el usuario o bien por el propio programa SPSS (mximo 8 caracteres). Las filas, a su vez, estn numeradas de forma correlativa.
- Vista de variables: recoge las caractersticas de las variables o lo que es lo mismo, de las columnas. Informa sobre el Nombre de la variable, el Tipo (Numrico, Cadena, Fecha,..), el Ancho de la variable, el nmero de decimales (en el caso de variables numricas), la Etiqueta (permite introducir una pequea descripcin de la variable), etiquetas para Valores de la variable, etiquetas para identificar valores Perdidos, el ancho de columna, la Alineacin y la Medida.
Creacin de un archivo
1. Debemos crear la estructura (definir las variables) de un nuevo archivo de datos de SPSS. Para cada variable habr que ir especificando cada una de sus caractersticas, empezando por el nombre (primera columna). 2. Definir etiquetas para cada variable, pueden ser de hasta 60 caracteres. se escribe un cdigo en la zona en la que aparece Valor y la etiqueta correspondiente en la zona de Etiqueta de valor y despus pulsar el botn de Aadir; as, en la Figura 3.2, al cdigo 1 se le ha asignado la etiqueta no, al cdigo 2 se la ha asignado la etiqueta moderado y al cdigo 3 se le aadir la etiqueta grave en cuanto pulsemos el botn Aadir.
7
3. Hay que definir los valores perdidos, que stos seran las NO-respuestas por parte de los entrevistados, generalmente se le asigna un nmero grande y fcil de tabular a fin de que no se confunda con los valores de anlisis, usualmente se asigna 99. 4. No olvides grabar tu documento para no perder la informacin almacenada.
Vista de archivo
Un archivo de datos tendra mas o menos el siguiente aspecto:
Estadsticas Descriptivas
El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que resultan tiles para describir muchos tipos de variables. Es un buen procedimiento para una inspeccin inicial de los datos. Supongamos que deseamos estudiar una muestra de 50 sujetos a los que hemos medido cinco variables: edad, sexo, peso y altura. Veamos la salida que nos proporciona el procedimiento frecuencias.
10
En primer lugar, al ejecutar este procedimiento, nos aparece una ventana en la que hemos de seleccionar las variables sobre las que deseamos obtener la informacin. Supongamos que en nuestro caso, deseamos ver qu ocurre si seleccionamos las variables edad y sexo.
Si pulsamos aceptar sin modificar ninguna otra opcin, la salida que proporciona el programa es la siguiente, para cada variable seleccionada:
11
12
Adems, en el procedimiento frecuencias podemos establecer una serie de opciones. Si en la ventana de Frecuencias elegimos el botn de Estadsticos, podemos elegir un conjunto de ellos sobre las variables seleccionadas (valores percentiles, estadsticos de posicin, de dispersin o sobre la forma de la distribucin).
Si en ese cuadro seleccionamos, por ejemplo, media, mediana, desviacin tpica y varianza y lo ejecutamos para la variable edad, los resultados proporcionados, adems del cuadro referente a las frecuencias, seran:
13
14
Igualmente, en el procedimiento Frecuencias existe una opcin para dibujar grficos. Si seleccionamos esa opcin aparecer la siguiente ventana:
El procedimiento Descriptivos muestra estadsticos de resumen univariados para variables en una nica tabla y calcula puntuaciones tipificadas (puntuaciones z).
Si seleccionamos la opcin Histogramas, por ejemplo, la salida sera:
15
16
Si se ejecuta el procedimiento para el conjunto de variables seleccionadas, la salida que proporciona el programa es la siguiente:
Adems de los estadsticos que aparecen en el cuadro anterior es posible aadirles otros. Simplemente en el cuadro de Descriptivos hay que pulsar sobre el botn Opciones y aparecer la siguiente ventana:
En ella se pueden seleccionar ms estadsticos y elegir el orden de visualizacin de las variables (alfabtico o por el valor ascendente o descendente de las medias).
17
18
Tablas Cruzadas
El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y adems proporciona 22 pruebas y medidas de asociacin para tablas de doble clasificacin. Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de doble clasificacin. Si se especifica una fila, una columna y un factor de capa (variable de control), el procedimiento tablas de contingencia crea un panel de medidas y estadsticos asociados para cada valor del factor capa.
19
20
En nuestro ejemplo vamos a realizar una tabla de contingencia para las variables edad en filas y sexo en columnas. Veamos la salida que proporciona:
El procedimiento Tablas de contingencia tiene tres posibilidades. Como siempre para acceder a ellas debemos pulsar los botones de la parte inferior de la ventana de Tablas de contingencia. La primera opcin es Estadsticos. Esta opcin proporciona distintos estadsticos que hemos de seleccionar en funcin del tipo de variables con las que estamos trabajando (dicotmicas, nominales, ordinales, etc.).
21
22
Adems, el procedimiento permite acceder a la ventana Casillas. Esta ventana permite descubrir las tramas en los datos que contribuyen a una prueba chi-cuadrado significativa. As permite mostrar las frecuencias esperadas y tres tipos de residuos que miden la diferencia entre las frecuencias observadas y las esperadas. Cada casilla de la tabla puede contener cualquier combinacin de recuentos, porcentajes y residuos seleccionados.
Por ltimo, la opcin Formato permite, como en otros procedimientos del programa, elegir las filas en orden ascendente o descendente.
23
24
Regresin y Correlacin
En todo problema de regresin y correlacin, el primer paso consiste en dibujar la nube de puntos, con objeto de detectar posibles no-linealidades en la relacin o alguna otra falla en las hiptesis del modelo de regresin lineal. El procedimiento que permite dibujar nubes de puntos, lo encuentras en Grficos Diagrama de Dispersin.
Para llevar a cabo una Regresin Lineal, se realiza con el procedimiento Analizar Regresin Linea Para llevar a cabo una Correlacin, se realiza con el procedimiento Analizar Correlaciones Bivariadas
25
26
Anlisis de Varianza
Para llevar a cabo un Anlisis de Varianza, se realiza con el procedimiento Analizar Comparar Medias ANOVA de un factor
Bibliografa
27
28
Crditos:
29
Anlisis de Varianza
El anlisis de varianza (ANOVA) prueba medias de dos o ms poblaciones, se utiliza para analizar resultados experimentales. Generalmente la hiptesis nula es que todas las medias son iguales. Por ejemplo, supongamos que un investigador quiere saber si los consumidores constantes, regulares y ocasionales, ms los no-consumidores de la avena en sobres de sabores Quaker, difieren en su preferencia a la avena Quaker, medido en una escala Likert de nueve puntos. La hiptesis nula de que no difiere la preferencia por la avena de los cuatro grupos puede verificarse con un anlisis de varianza.
1 2

Sesin 17. Anlisis bivariado: varianza (ANOVA)
El ANOVA puede responder a preguntas cmo: El anlisis de varianza debe tener una variable dependiente, que en este caso sera la preferencia por la avena, que es mtrica (medida en una escala de intervalo o razn). Las variables independientes deben ser variables nomtricas, como consumo constante, regular u ocasional. A las variables independientes se les llama factores. Una combinacin particular de niveles de factores se llama tratamiento. Cmo vara la intencin de compra del producto por parte de los consumidores segn los niveles de precios? Varan las opiniones de las polticas de distribucin de la empresa entre los agentes, vendedores y mayoristas? Vara el nivel de consumo de mi producto segn el segmento?
Anlisis de Varianza Estadsticos principales

Eta2 (2). La fuerza de los efectos X en Y. El valor de 2 vara entre 0 y 1. Estadstica F. Con esta estadstica se verifica la hiptesis nula de que las medias de las categoras son iguales. SCA. Tambin se denota SCx. Es la variacin de Y relacionada con la variacin de las categoras de X. SCE. Se denota con Scerror. Es la variacin de Y debido a la variacin en cad una de las categoras de X. SCy. Variacin total de Y.
5
Etapas del ANOVA de un factor
Identificar variables dependiente e independiente
Descomponer la variacin total
Medir los efectos
Probar la significacin
Interpretar resultados
Etapas del ANOVA de un factor

Todo el proceso se puede hacer en forma manual, pero es muy largo y complicado, y si se tienen gran cantidad de datos tiene que recurrirse a algn tipo de software. En la prctica todo se resume en un estadstico, F, y tiene desglosados todos los componentes del mismo. El formato general de una tabla de ANOVA que arrojan los paquetes estadsticos generalmente tiene los siguientes componentes: Fuente de Variacin
Tratamientos
Tabla de Anova
Suma de Grados de Cuadrado Cuadrados libertad Medio
SSCA k-1
MSTR= SSCA/ k-1
F= MSTR/MSE
Error
SCE
nT - k
MSE= SCE/nT - k
Total
SSy
nT-1
Donde: k=nmero de tratamientos, nT= Nmero total de datos
Estadstico F
Este tipo de anlisis fue ideado por Sir Ronald A. Fisher

que durante los aos 1912 a 1962 y contribuy en forma notable a un modo de pensamiento y filosofa estadstica moderna. Frmula:
Por ejemplo, si tenemos 3 programas distintos de incentivos y queremos ver cul aumenta el rendimiento de manera ms eficaz, utilizamos el anlisis de varianza. Queremos medir el rendimiento de cada grupo y averiguar si existen o no diferencias entre ellos.
F=
SCx / ( c 1 ) Scerror / ( N c) )
10
Estadstico F
Si la probabilidad o significancia del Estadstico F es menor a .05 rechazaremos la hiptesis de igualdad de medias y concluiremos que no todas la medias poblacionales comparadas son iguales. En caso contrario, no podemos rechazar la hiptesis de igualdad y no podremos afirmar que los grupos comparados difieran en sus promedios poblacionales.
Sumas de cuadrados Entre grupos Dentro de los grupos 3.95331 Grados de libertad 4 Medias cuadrticas 0.98832753 F 8.252442 Sig. .000
4.431188
37
0.119761824
Total
8.384498
41
En una tabla este es el valor que se evala y se compara en base a .05.
11
12
Estadstico F
En este caso, puesto que la significancia da a .000, entonces vemos que .05 es mayor que .000, por lo cual se rechaza la hiptesis nula y podemos concluir que s existe una diferencia en rendimiento de acuerdo al programa de incentivos utilizado.
Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4).
13
14
Crditos:
15
Anlisis multivarainte
Es el anlisis simultneo de ms de dos variables.

Sesin 18. Anlisis multivariante. Tcnicas dependientes
Se pueden categorizar en funcin a: Si alguna de las variables se puede identificar como dependiente de otra u otras Existe ms de una variable dependiente La naturaleza de los datos (tipo de escala)
Propsitos del anlisis multivariante

Comprender la relacin de los datos (mediante las distancias de stos) Visualizarlos Hacer modelos Obtener informacin correlacionada Reducir los datos o simplificar la estructura de stos Sortearlos y agruparlos Investigar la dependencia entre las variables Predecir Construir hiptesis y probarlas
3
Anlisis multivariante
Tcnicas Multivariantes
Tcnicas de Dependencia
Una Variable Dependiente
Tcnicas de Interdependencia
Interdependencia variables Semejanza entre objetos
Mas de una variable dependiente
Regresin Mltiple Correlacin Discriminante Cannica Medicin Conjunta Varianza y Covarianza
Anlisis Conglomerado Factor Comn Escala Multidimensional

4
Tcnicas dependientes
Una variable dependiente Regresin Mltiple Anlisis Discriminante Varianza y Covarianza Medicin Conjunta
Regresin mltiple
Examina la relacin entre por lo menos 2 variables independientes de intervalos de escala y una variable dependiente de intervalo de escala. La ecuacin predictiva : Y= a + b1X1 +b2X2
Las variables independientes se utilizan para predecir la dependiente
Mltiples variables dependientes Correlacin Cannica
X1 y X2 a, b1 y b2 son los coeficientes de regresin generados a partir de datos de la muestra, que indica la contribucin relativa de dicha variable para explicar la dependiente
5 6
Regresin mltiple ejemplo

Un coeficiente positivo indica una relacin directa entre esa variable independiente y la variable dependiente, un coeficiente negativo indica una relacin inversa. El tamao del coeficiente indica la cantidad de cambio en la variable dependiente asociado con un incremento de una unidad en dicha variable independiente, asumiendo que todas las dems variables independientes permanezcan constantes. Considera la siguiente ecuacin de regresin mltiple: Y = 121 + 0.2 X1 + 5.2 X2 R2 = 0.42 donde: Y = Estimado de ventas, X1 = Costo de publicidad, X2 = Ingresos Las ventas tienden a aumentar en .2 unidades por cada unidad incrementada en el costo de publicidad y en 5.2 unidades por cada incremento en los ingresos R2 es el coeficiente de determinacin mltiple, indica la proporcin de la variacin en Y explicado por la regresin. 42% de la variacin en Ventas pueden ser relacionadas por el costo de publicidad y el ingreso.
8
Anlisis discriminante
Este anlisis busca generar dimensiones que permitan separar los objetos tanto como sea posible, a partir de grupos ya determinados Se utiliza con una variable dependiente en escala nominal y un conjunto de variables independientes en escala de intervalo.
Objetivos: 1) Analizar si existen diferencias entre los grupos en cuanto a su comportamiento con respecto a las variables consideradas y averiguar en qu sentido se dan dichas diferencias (descriptivo). 2) Elaborar procedimientos de clasificacin sistemtica de individuos de origen desconocido, en uno de los grupos analizados. (predictivo).
10
D= b0 +b1X1+b2X2+b3X3 + bkXk Dnde: D = Puntuacin discriminante bx = coeficientes o peso discriminante Xs = variables independientes Funcin discriminante. Combinacin lineal de las variables independientes que diferencie al mximo los puntajes de las medidas a travs de categoras de la variable dependiente.
Anlisis discriminante Ejemplo

Walt Mart est interesado en analizar la opinin de sus clientes con respecto a la tienda. Para ello realiza una encuesta a una muestra de 200 de ellos en las que le pide que valoren su labor haciendo una valoracin entre 0 y 5 en los siguientes aspectos: Limpieza, Precios Competitivos, Disponibilidad de Productos, Servicio en Caja, Calidad, Cercana y Promociones. Adems, tiene clasificados a sus clientes en dos grupos de acuerdo a si tienen hijos o no. El nmero de clientes pertenecientes al grupo de muestra con hijos es igual a 120 y el del grupo sin hijos es de 80.
11
12
Varianza y Covarianza
El objetivo del estudio es analizar si existen diferencias en cuanto a la percepcin de la tienda entre los clientes con hijos y los clientes sin hijos, y en caso de que existan, analizar en qu sentido se dan dichas diferencias. En este caso, existen 7 variables clasificadoras (p=7) y dos grupos a discriminar (q=2). El tamao de la muestra es n=200 con n1 = 120 y n2 = 80. Anlisis de Varianza (ANOVA) se utiliza en el anlisis de datos experimentales. Requiere una variable dependiente en escala de intervalos y una variable o variables independientes en escala nominal. Anlisis de Covarianza (ANCOVA) se utiliza en situaciones en donde se descubre despus del experimento, que alguna fuente externa de variacin contribuye a los valores de la variable dependiente. Se requiere una variable dependiente en escala de intervalos y variables independientes en escala nominal.
14
13
Medicin conjunta
Se ocupa de los efectos conjuntos de dos o ms variables independientes nominales en la disposicin de una variable dependiente ordinal. Se utiliza para medir los intercambios que los consumidores hacen sobre atributos de productos; para predecir la participacin de mercados o la rentabilidad de un producto que ofrece varias combinaciones de atributos. Es til en el diseo de nuevos productos o servicios.
15
Medicin conjunta Ejemplo

Resumen de Importancia de los atributos en la seleccin de un automvil
Importance summary
50 40
Averaged Importance Importancia promedio
30
20
10
0 Colour carro Color del of car Brand Name
Marca
Repairs for one yearTamao del motor Seguridad Engine size as indic
Factor
16
Correlacin cannica
Es apropiada cuando se tiene un conjunto de variables dependientes en escala de intervalos y un conjunto de variables independientes. El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que proporcione la correlacin nica mxima entre el conjunto de variables dependientes y el conjunto de variables independientes. Ejemplo. Para conocer la forma en que un conjunto de actitudes se relacionen con un conjunto de comportamiento.
17
Que hemos aprendido hasta hoy...

El anlisis multivariante nos permite analizar mltiples variables simultneamente para entender la relacin (distancia), correlacin, agrupar datos o simplificar la estructura de estos. Podemos definir dos tcnicas multivariantes, dependientes e interdependientes. En las tcnicas dependientes una o ms variables pueden identificarse como dependientes (el resultado estudiado o evento) y las dems variables como independientes.
18
Bibliografa
Los mtodos estadsticos a utilizar dependen de si tenemos una o ms variables dependientes y el tipo de escala de los datos. Una variable dependiente: Regresin Mltiple, Anlisis Discriminante, Varianza y Covarianza, Medicin Conjunta. Mltiples variables dependientes: Correlacin Cannica Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).
19
20
Crditos:
21
Anlisis multivariante
Tcnicas Multivariantes

Sesin 19. Anlisis multivariante: tcnicas interdependientes
Tcnicas de Dependencia
Una Variable Dependiente
Tcnicas de Interdependencia
Interdependencia variables Semejanza entre objetos
Mas de una variable dependiente
Regresin Mltiple Correlacin Discriminante Cannica Medicin Conjunta Varianza y Covarianza

1
Anlisis Conglomerado Factor Comn Escala Multidimensional

2
Tcnicas interdependientes
No hace diferencias entre variables dependientes e independientes, analiza el conjunto completo de la interrelacin de las variables. Enfoque en variables Anlisis Factor Comn Enfoque en objetos Anlisis Conglomerado (Cluster) Escalas Multidimensionales
Anlisis de factor comn

Procedimiento que selecciona un gran nmero de variables u objetos y se investiga si tienen un numero pequeo de factores en comn que expliquen su intercorrelacin. Pasos: 1. Matriz de correlacin entre variables: Factor R. correlaciones entre variables Factor Q. correlacin entre casos 2. Extraccin de factores de la matiz de correlacin. 3. Rotacin de factores iniciales.
3 4
Anlisis de factor comn Ejemplo

Matriz de correlacin
X1 X1 X2 X3 X4 1.00 X2 0.85 1.00 X3 0.35 0.95 1.00 X4 0.20 0.15 0.75 1.00
En este ejemplo se tienen 4 variables y mediante la matriz de correlaciones se identificaron 2 factores (A y B)
Las cargas de la matriz de factores miden cules variables estn involucradas en qu patrn factorial, hasta qu grado y en qu direccin. (se lee como correlacin). Se le asigna a cada factor un nombre creativo que identifique el conjunto de variables.
Interpretacin de factores
Factor A (Innovadores) X1, X3, x4
Rotacin de Factores
Variable X1 X2 X3 X4 A .63 .48 .70 .76 B .38 .53 .26 -.54
Factor B (seguidores)
X2
Anlisis conglomerado
El objetivo es clasificar una muestra de entidades (personas u objetos) en un nmero pequeo de grupos mutuamente excluyentes basados en similitudes entre las entidades. En el anlisis conglomerado, a diferencia del anlisis discriminante, los grupos no estn pre-definidos. Por consiguiente, se usa la tcnica para identificar los grupos de casos u observaciones relativamente homogneos.
Anlisis conglomerado Ejemplo

Se utiliza en: Segmentacin de Mercado, definicin del mercado meta, posicionamiento de productos y desarrollo de nuevos productos.
Dendograma.
Se mide las distancia entre las similutues/diferencias de los objetos o de la matriz de correlacin para hacer Agrupamientos.
Objeto 1 Objeto 2 Objeto 3 Objeto 4 Objeto 3 Objeto 6
Distancia
7 8
Escala multidimensional MDS

Obtiene las dimensiones de los juicios de los encuestados sobre la similitud o preferencias de los productos transformndolos en distancias. Se utilizan mapas preceptales de dos o ms dimensiones para tener un diagrama visual de las preferencias y percepciones. Se utiliza en preferencias por marcas o tiendas.
Escala multidimensional MDS Ejemplo

MDS Anlisis para los refrescos: Coca Cola, Pepsi, Big Cola, Fanta, Sprite Variables que los consumidores clasificaron en 6 atributos: Buen sabor, Refrescante, Alta calidad, Alto contenido de azcar, Quita la sed, Barato. MDS muestra la relacin entre las variables colocndolas en una espacio multidimensional. Con estas dimensiones, las cuales fueron definidas por los atributos de los refrescos, el MDS ilustra la posicin de los refrescos en la mente del consumidor.
9 10
Mapa perceptual refrescos Ejemplo

Barato
Que hemos aprendido hasta hoy...

El anlisis multivariante nos permite analizar mltiples variables simultneamente para entender la relacin (distancia), correlacin, agrupar datos o simplificar la estructura de stos. Podemos definir dos tcnicas multivariantes, dependientes e interdependientes.
BIG COLA
Alto en azcar
FANTA
Buen sabor
COCA COLA PEPSI

Alta calidad
Refrescante
SPRITE
Quita la sed 11
Las tcnicas interdependientes analizan el conjunto completo de la interdependencia de las variables, sin distinguir variables dependientes.
12
Bibliografa
Se puede clasificar si se tiene enfoque a objetos o a variables, los mtodos estadsticos para las tcnicas interdependientes estn en funcin de esta clasificacin. Enfoque en variables: Anlisis de Factor Comn Enfoque en objetos: Anlisis Conglomerado (Cluster), Escalas Multidimensionales MDS Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).
13
14
Crditos:
15
Qu es un reporte de investigacin...
Un documento escrito y/o una presentacin oral basada en la documentacin escrita que comunica el propsito, los objetivos, el alcance, la hiptesis, la metodologa, los hallazgos, las limitaciones y finalmente las recomendaciones del proyecto de investigacin. Es el ultimo paso del proceso de la investigacin de mercados. Es ms que un resumen de lo investigado, es un registro del proceso de investigacin.

Sesin 20. Presentacin de resultados
Proceso de preparacin del reporte

Definicin del problema Diseo de investigacin Metodologa Anlisis de Datos
Consideraciones para la elaboracin del Informe escrito

Considerar la audiencia objetivo Empezar con lo simple Definir trminos tcnicos Utilizar palabras sencillas que conozcan los lectores Utilizar ayudas grficas o visuales Facilitar la lectura de cifras, utilizando porcentajes, redondeo, rangos, etc. Tener en cuenta las necesidades de informacin Asegurar la relacin de los hallazgos con los objetivos gerenciales. Entender la informacin y dar conclusiones interpretativas de stas.
Antes del reporte escrito
Interpretacin de los hallazgos
Preparacin del Informe
Reporte Escrito
Presentacin Oral
Despus del Reporte Escrito
SEGUIMIENTO Lectura por parte del cliente
Ser conciso y preciso Seleccionar la informacin de manera de no meterse en detalles, pero si enfocarse en las necesidades de informacin al momento de redactar el informe. En ocasiones una imagen o grfica dice ms que mil palabras. No repetir informacin innecesaria. Objetividad No sesgar ni favorecer la informacin, debe presentarse los hallazgos y defender su validez en caso necesario.
Comunicacin Definir un estilo de redaccin considerando: Lenguaje de negocios, breve Palabras y frases cortas Ser conciso Apariencia (utilizacin de espacios) Informacin estadstica visual Utilizar tiempo presente Voz activa No modismos Colocar citas de los encuestados
D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006
Formato del informe escrito

Portada Tabla de contenido ndice de tablas ( grficas, imgenes, figuras, etc) Resumen ejecutivo Cuerpo del informe Conclusiones y recomendaciones Apndice
Portada
Titulo que trasmita la esencia del estudio, atractivo que invite y despierte el inters por la lectura Fecha Organizacin o persona que lo emite o presenta Organizacin o personas a quien va dirigido
Tabla de contenido Secuencial de los temas que se cubren en el informe y paginacin Objetivo. Ayudar en la identificacin rpida de los temas de inters ndice de tablas Puede ir junto con la tabla de contenido o por separado. Contiene los ttulos y la paginacin de todos los apoyos visuales incluidos.
Resumen ejecutivo Abreviacin o sntesis de los aspectos importantes de la investigacin. Debe tener los hallazgos de mayor impacto, ya que algunos ejecutivos solo es lo que leen del informe, deben facilitar el emprender una accin. Debe incluir: Objetivos de la investigacin Naturaleza del problema de decisin Resultados Conclusiones (opiniones basadas en la investigacin) Recomendaciones
Cuerpo del informe Introduccin Informacin bsica del proyecto, naturaleza del problema de decisin y objetivos. Metodologa Describir la naturaleza del diseo de la investigacin, plan muestral, procedimiento de recoleccin y anlisis de datos. Tipo de investigacin exploratoria o concluyente, especificar las fuentes de datos, el mtodo de recoleccin. Es un resumen de los aspectos tcnicos que desarrolla la confiabilidad de la investigacin.
Cuerpo del informe Resultados Flujo lgico de informacin para el propsito de toma de decisiones. Limitaciones Apartado cuya finalidad es permitir al lector juzgar la validez. Entre las limitaciones se involucran las insuficiencias del muestreo.
Conclusiones Relacin de los hallazgos de la investigacin con las necesidades de informacin, pueden formularse recomendaciones. Apndice Material no esencial, pero relacionado con el objeto de estudio, tal como formatos de recoleccin, detalles del plan de muestreo, estimativos, instrucciones, estadsticas.
Presentacin de los datos

Se utilizan apoyos visuales como grficas o tablas para la presentacin de datos cuantitativos o procesos tcnicos. Elementos de los apoyos visuales: Nmero de la tabla o figura Ttulo del contenido de la tabla Ttulos horizontales y verticales Organizacin Bases de las mediciones Notas de pie de pgina
Tipos de Presentacin de los datos

Tabular Presentacin numrica de datos. Grficas Presentacin de datos (nmeros, tendencias y relaciones) en trminos de tamao interpretados visualmente. Las ms utilizadas son: Graficas de pastel (representa relaciones proporcionales). Graficas de barras (representa magnitud). Graficas de lnea (representa tendencias) (histograma, polgono de frecuencia, de barras). Mapas geogrficos o perceptuales Representan ubicacin relativa y/o dimensiones. Pictogramas Despliegue de datos con imgenes o smbolos pequeos.
Presentacin Oral
La clave para una presentacin eficaz es la preparacin. Cuidar el lenguaje corporal. Principio Dgales: 1) Dgales que va a decir. 2) Dgales. 3) Dgales que les dijo. Principio SIDI: Hgalo simple y directo. Antes de la presentacin Verificar equipo y material a utilizar. Tener un plan de contingencia en caso de falla de equipo. Analizar la audiencia, como ser la reaccin, se debe comenzar con ideas en comn. Practicar la presentacin varias veces.
Durante la presentacin Empezar con una visin general. No dar la espalda a la audiencia. Evitar leer un guin, dirigirse a las personas. Utilizar notas para evitar olvidar algn punto y dar una secuencia ordenada a la presentacin. Utilizar apoyos visuales, simples y fciles de interpretar. Evitar poses o movimientos innecesarios. Evitar muletillas o modismos. Preguntar si quedo alguna duda (repetir la pregunta, no inventar respuestas, ser breve).
Bibliografa
Crditos:

Analisis e Interpretacion de Resultados

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis e Interpretacion de Resultados

Cargado por

Copyright:

Formatos disponibles

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

AM04003-Anlisis e interpretacin de resultados

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Marco muestral o de referencia

Por qu una muestra?

Beneficios del muestreo

Lic. Ana Mara Lpez Navarro

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

AM04003-Anlisis e interpretacin de resultados

2. Identificar el marco muestral

2. Identificar el marco muestral

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

2. Identificar el marco muestral

2. Identificar el marco muestral

3. Seleccionar un mtodo de muestreo

4. Determinar el tamao de la muestra

Aleatorio simple Sistemtico

4. Determinar el tamao de la muestra

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Lic. Ana Mara Lpez Navarro

Universidad Tec Milenio: Profesional AM04003 Anlisis en interpretacin de resultados

AM04003-Anlisis e interpretacin de resultados

De juicio Por cuotas Bola de nieve

Muestreo por cuotas

Muestreo por cuotas

Universidad Tec Milenio: Profesional AM04003 Anlisis en interpretacin de resultados

Lic. Ana Mara Lpez Navarro

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

AM04003-Anlisis e interpretacin de resultados

Aleatorio simple Sistemtico Estratificado Por agrupamiento

Muestreo aleatorio simple

Muestreo aleatorio simple

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

El intervalo de salto sera cada 50 personas o nombres.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

6. En cada estrato, seleccionar una muestra aleatorio simple de tamao nh.

Muestreo por agrupamiento

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Lic. Ana Mara Lpez Navarro

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

AM04003-Anlisis e interpretacin de resultados

Enfoque basado en costo

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Relacin precisin/tamao de la muestra

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Factor de correccin de la poblacin finita

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Factor de correccin de la poblacin finita

Donde: n = tamao revisado de la muestra n = tamao original de la muestra N = tamao de la poblacin

Lic. Ana Mara Lpez Navarro

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Planeacin de las operaciones de campo

AM04003-Anlisis e interpretacin de resultados

Programacin del tiempo Presupuesto Trabajadores de campo Medicin del desempeo

Programacin del tiempo

Programacin del tiempo

Programacin del tiempo

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Medicin del desempeo

Medicin del desempeo

Mtodos de recoleccin de datos

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Lic. Ana Mara Lpez Navarro

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados