Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase
Clase
Análisis de Datos
Reglas básicas:
– Ser específico.
– Usar palabras simples.
– Armar preguntas cortas.
– No generar un diálogo con el entrevistado.
– No ser excesivamente específico.
3
Tipos de preguntas: De respuesta
abierta
Estas preguntas no proveen respuestas
opcionales.
5
Tipos de preguntas: De opciones
ordenadas
El club necesita más canchas de tenis ¿Cuál es su edad?
completamente en desacuerdo Menos de 25
medianamente en desacuerdo entre 25 y 35
ni de acuerdo ni en desacuerdo entre 36 y 50
medianamente de acuerdo entre 51 y 65
completamente de acuerdo más de 65
10
Estructura de una pregunta:
Comparaciones
Respuesta con opciones:
En su opinión, ¿cuál de los siguientes problemas
que afectaron a la agricultura durante los 90s es
el más serio?
A- Problemas ambientales
B- Problemas económicos
C- Problemas políticos
El entrevistado debe elegir el problema que
considera más importante dentro de una lista
predefinida.
11
Estructura de una pregunta:
Comparaciones
Respuesta con opciones, parcialmente abierta:
En su opinión, ¿cuál de los siguientes problemas
que afectaron a la agricultura durante los 90s fue el
más serio?
A- Problemas ambientales
B- Problemas económicos
C- Problemas políticos
D- Otro (especificar):___________________
En este caso, la situación es similar a la anterior,
pero se permite que el encuestado tenga la libertad
de elegir algún otro problema que no ha sido
12
considerado.
Secuencia del cuestionario
Preguntas introductorias: Las primeras preguntas
deben estar relacionadas al tema principal de
investigación y deben despertar el interés del
encuestado.
Preguntas relacionadas: Deben agruparse en
secciones del cuestionario.
Preguntas sensitivas: Se recomienda incluirlas hacia
el final del cuestionario.
Preguntas importantes: Es deseable incorporar tests
sobre la calidad de las respuestas a estas preguntas.
Secuencia lógica: Siempre debe respetarse. 13
Diseño de Cuestionario
1) Con que frecuencia visita el shopping? 4) Cual de las promociones del shopping recuerda?
– Diaria – Pascuas
– 3 por semana – Día del padre
– 1 por semana – Día de la madre
– 1 por mes – Día del amigo
2) Cual es el motivo de la visita? – Navidad
– Compras – Ninguna
– Entretenimientos 5) Y qué recuerda?
– Otros – Premios
3) Es usted de participar en promociones? – Juegos
– No – Nada
• Por que? 6) Participó?
• No me interesan – Si
• No creo en ellas – No
• No me gustan los Sigue el cuestionario con otras preguntas.
premios
• Otros
14
– Si
Resultados
Participa en promociones?
27%
No
73% Si
n = 200
15
Resultados
Figura 2
25%
No participa en las
promociones del
shopping
Participa en las
promociones del
shopping
75%
n = 200
16
Resultados
Participa en promociones y ademas...
70
63
60
50
37
40
%
30
20
10
0
No participa en las promociones Participa en las promociones
del shopping del shopping
17
Diseño de Cuestionario
0) Presentación general y datos
personales. 4) Cual de las promociones del
1) Con que frecuencia visita el shopping? shopping recuerda?
– Diaria – Pascuas
– 3 por semana – Día del padre
– 1 por semana – Día de la madre
– 1 por mes – Día del amigo
2) Cual es el motivo de la visita?
– Navidad
– Compras
– Ninguna
– Entretenimientos 5) Y qué recuerda?
– Otros – Premios
3) Es usted de participar en promociones?
– Juegos
– No
– Nada
• Distintas 6) Participó?
opciones de por 18
– Si
Resultados
Participa de promociones?
Shopping
17%
No
Si
73% 27%
Otras
10%
19
Algunas consideraciones especiales
Muchas veces los encuestados responden de
forma apresurada. Ello puede generar errores de
medición.
21
Tipos de Datos
Datos
Categóricos Cuantitativos
Ordinales Nominales
22
Variables discretas y
continuas
Una variable es discreta si toma solo un
número contable de valores. Una variable es
contínua si la misma toma un número
incontable de valores.
Variable discreta Variable continua
23
Estadística Descriptiva
Abarca la agrupación, resumen y
presentación de los datos para permitir su
interpretación y poder tomar decisiones
basadas en dicha interpretación.
24
Variables Categóricas
25
Variables cuantitativas
Las variables cuantitativas continuas toman un
número considerable de valores.
160
120 200
160
120
80
40
0
0 1 2 3 4
80
40
0
0 1 2 3 4
27
Medidas de Posición Central:
Usualmente, nuestra atención se centra en
dos aspectos de las medidas de posición
central:
28
Medidas de Posición Central: la media
31
Media y Mediana
La media es sensible a observaciones extremas y a outliers.
33
Aspecto general de una
La figura muestra la distribución de ventas de
distribución
libros por individuo en la feria del libro. Esta
distribución es asimétrica hacia la derecha. Es
decir hay muchas ventas de 3 o 4 libros y pocas
ventas de 10 libros.
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12
34
Medidas de dispersión
Caracterizar una distribución solamente a través de una
medida central no es apropiado.
36
Medidas de dispersión
El rango depende sólo de las observaciones
máxima y mínima, que podrían ser
observaciones atípicas.
Podríamos mejorar nuestra descripción de la
dispersión fijándonos, por ejemplo, también
en la dispersión del 50% de los valores
centrales de nuestros datos.
Un conjunto de estadísticos de utilidad son
los cuartiles de una distribución.
37
Cuartiles
Para calcular los cuartiles de una distribución
debemos:
40
Diagrama de caja
Los cinco números resumen de una
distribución son representados
gráficamente por un diagrama de caja.
L - Observación máxima
Q3 - Tercer cuartil
Q2 - Mediana
Q1 - Primer cuartil
S - Observación mínima 41
Diagrama de caja
Los lados inferior y superior de la caja van del primer al
tercer cuartil. Por tanto, la altura de la caja es la
amplitud del 50% de los datos centrales.
El segmento del interior de la caja indica la mediana.
Los extremos de los segmentos perpendiculares a los
lados superior e inferior indican, respectivamente, los
valores máximo y mínimo de la distribución.
S Q1 Q2 Q3 L
42
Una medida de dispersión: La varianza
La varianza s2 de un conjunto de observaciones es el
promedio de los cuadrados de la desviaciones de las
observaciones respecto a su media. Formalmente:
( x1 x ) ( x 2 x ) ... ( x n x )
2 2 2
s
2
De forma compacta:
n 1
1
s
2
n 1
(x i x) 2
43
El desvío estándar
44
Coeficiente de variación
El coeficiente de variación es una medida de
dispersión relativa.
Muestra la dispersión de una distribución en
relación a su media.
Se utiliza para comparar distintas distribuciones.
Su fórmula es:
s
CV
x
Por ejemplo, un desvio standard de 10, puede ser
grande si la media es 100, pero no lo es si la
media es 500. 45
Medidas de asociación en variables
cuantitativas
(x i x)(y i y)
Covarianza muestral cov(X, Y)
n -1
46
Coeficiente de Correlación
+1 Correlación lineal positiva fuerte
El valor se encuentra cerca de 1 COV(X,Y)>0
47
Medidas de Asociación en
Variables Categóricas
Tablas de Contingencia
El objetivo de la tabulación cruzada es identificar
la relación que existe entre dos variables. Con los
datos de una muestra podemos observar si existe
alguna relación entre dos variables y la pregunta
que surge naturalmente es si esta relación es
verdadera o es el resultado del error muestral.
Las tablas de contingencia son tabulaciones
cruzadas entre dos variables X e Y con r y c
categorías respectivamente. Es decir que la tabla
de contingencia entre X e Y tendrá r filas y c
columnas. 48
Tablas de Contingencia y
Medidas de Asociación
Para identificar si existe relación entre dos variables categóricas se
utiliza un test de hipótesis conocido como el test Chi-cuadrado de
Pearson. La hipótesis nula del test es que las dos variables
analizadas son independientes. La hipótesis alternativa es que las
variables no son independientes, es decir que existe una relación
entre las dos variables.
Por ejemplo, la siguiente tabla de contingencia muestra la tabulación
cruzada de la variable ingreso anual (dividido en tres categorías) y la
última marca de coche comprada (dividida en tres marcas).
49
Tablas de Contingencia y
Medidas Marca
de Asociación
del último auto comprado
Ford Toyota Renault Total
Ingreso anual
Eij = (NAi*NBj)/N.
56
Tablas de Contingencia y
Medidas de Asociación
El estadístico de Pearson nos dice si dos variables
son independientes una de otra pero no nos dice
nada acerca de la naturaleza de la relación.
2
C
2
n
59
Medidas de Asociación para
Tablas de 2x2
Cuando analizamos variables dicotómicas
(adoptan solo los valores 0, 1) el estadístico
de Pearson puede ser poco preciso. En esos
casos se suelen utilizar otras medidas de
asociación.
60
Medidas de Asociación para
Tablas de 2x2
El Coeficiente Phi ()
Es una medida del grado de asociación entre
dos variables dicotómicas basada en el
estadístico Chi-cuadrado de Pearson.
Este coeficiente toma valores en el intervalo
cero-uno. Valores próximos a cero indican
poca asociación entre las variables y valores
cercanos a uno indican una fuerte
asociación.
61
Medidas de Asociación para
Tablas de 2x2
Puede ser calculado utilizando el estadístico
Chi-cuadrado de Pearson con la siguiente
fórmula:
= (2/N)1/2
62
GRACIAS
Consultores de Investigación
paholitacalderon@yahoo.es
alzamoradelosgodos@yahoo.es
63