01 - Guía para El Análisis de Datos

ANÁLISIS ESTADÍSTICO DE DATOS
Juan Bahamonde Sola

Recopilación: UCE-2019
Página 1 de 11
Análisis de datos de un Cuestionario con escala Likert.
Construcción de una escala
Pregunta 1:
¿Considera que el matrimonio igualitario debe ser respetado por todos los ciudadanos?
5 Muy de acuerdo
4 De acuerdo
3 Indiferente x
2 En desacuerdo
1 Muy en desacuerdo
…
Si el cuestionario tiene 25 preguntas, Pmin=1, Pmax=5
Puntaje total mínimo: Tmin= 1 * 25 = 25
Puntaje total máximo: Tmax= 5 * 25 = 125
Rango (Tmax – Tmin): R=125-25 = 100
Amplitud del Intervalo (R/Pmax): A= 100/5 = 20
Construcción de la escala para valorar el puntaje total por cada factor o dimensión.
Valor Etiqueta desde hasta

5 Muy de acuerdo 105 125
4 De acuerdo 85 104
3 Indiferente 65 84
2 En desacuerdo 45 64
1 Muy en desacuerdo 25 44
N P1 P2 P3 P4 … P25 Total Valor Etiqueta

1 3 1 5 1 1 78 3 Indiferente
2 5 5 2 1 4 93 4 De acuerdo
3 3 2 2 1 3 69 3 Indiferente
… 112 5 Muy de acuerdo
100 5 1 3 2 2 40 1 Muy en desacuerdo
Una variable numérica se puede categorizar o crear puntos de cortes con reglas probabilísticas
(intervalos con el método de Sturges); Se puede hacer con baremos basados en la teoría; se
pueden crear grupos con análisis factorial.
K= # de clases o intervalos
N=# observaciones de la muestra
Juan Bahamonde Sola
Página 2 de 11
a = Amplitud de cada intervalo
Dependiendo del estudio, los puntajes directos(total), calculados por factor, categoría,
dimensión o cuestionario, pueden ser clasificados a través de una escala cualitativa o
cuantitativa mediante baremos, centiles, desviaciones standard, etc.,:
N P1 P2 P3 P4 … P25 Total Percentil Etiqueta

1 3 1 5 1 1 78
2 5 5 2 1 4 93
3 3 2 2 1 3 69
… 112
100 5 1 3 2 2 40
Ejercicio de aplicación: Base de datos ExcelSPSS
1. Cálculo de nueva variable para obtener puntajes totales por factor, categoría o total
 Transformar/Calcular variable…
2. Transformar/Recodificar en distintas variables
Valores antiguos y nuevos;
 Rango desde-hasta
 Rango INFERIOR hasta el valor
 Rango, valor hasta SUPERIOR
3. Transformar/Agrupación Visual/Crear puntos de corte

 Intervalos de igual amplitud
 Percentiles iguales basados en datos explorados
 Media y Desviaciones estándar basados en datos explorados
Juan Bahamonde Sola
Página 3 de 11
Análisis de Contingencia o cruce de variables:
Las tablas de contingencia, término acuñado por Karl Pearson en 1904 (Sanchez Rivero, 1998),
se utilizan en estudios estadísticos interesados en la posible relación entre dos atributos
cualitativos de los individuos de una población. Usualmente cada atributo se maneja como una
variable cualitativa o , y la variación de cada variable está representada por los valores 1,
x2,x3,…xi y y1, y2, y3,…yj respectivamente. La información se organiza en un tabla de doble
entrada de observaciones bivariadas que tienen como primera columna y primera fila o
renglón, los valores que asumen y (Cañadas G., 2010)
En general, si se toma una muestra de tamaño de una población, y se desean estudiar dos
características de un mismo individuo o grupo de personas, se tiene que:
Sean estas características X y Y la muestra se divide en:
 Clase xi para la variable X

 Clase yj para la variable Y
 fij es la frecuencia absoluta o frecuencia observada en cada celda
 fi es la frecuencia absoluta acumulada en xi, distribución marginal por fila
 fj es la frecuencia absoluta acumulada en yi, distribución marginal por columna
Se utiliza la prueba de chi-cuadrado para la independencia o asociación de variables

categóricas.
Juan Bahamonde Sola
Página 4 de 11
Ref. www.bioestadistico.com
Juan Bahamonde Sola
Página 5 de 11
Juan Bahamonde Sola
Página 6 de 11
Criterios que deben ser considerados para seleccionar el estadístico de prueba:
1. Los tipos de investigación: transversal o longitudinal

2. Los niveles de la investigación: descriptivo (univariado o de un grupo); relacional o
analítico (bivariado o de 2 o más grupos)
3. Los diseños de la investigación: no experimentales y experimentales (longitudinal,
medidas repetidas con valores numéricos)
4. El objetivo estadístico: comparativas (Pearson y Spearman no es para comparativo)
5. La escala de medición de las variables: dicotómica o politómica, ordinal, numérica.
6. El comportamiento de los datos (distribución): normalidad y homocedasticidad
X2 Cuadrado de homogeneidad: utilizamos cuando tenemos dos grupos y queremos

comparar una variable aleatoria dicotómica o politómica. X2 no solo es aplicable para tablas
de 2x2 sino tablas mayores, es decir más de dos grupos.
T de Student para muestras independientes: se utiliza cuando queremos comparar dos

grupos y la variable aleatoria es numérica. Existen otras variedades de t de Student, como
cuando trabajamos con una sola muestra o un solo grupo.
ANOVA (de una sola vía o con un factor): Cuando necesitamos comparar más de dos grupos
usamos: Para comparar dos medidas en un solo grupo, usaremos t de Student para muestras
relacionadas. Estas pruebas paramétricas deben cumplir, además, distribución normal
(normalidad) y homogeneidad de varianzas (homocedasticidad). Cuando no cumplen
tenemos las pruebas equivalentes no paramétricas siendo la variable ordinal o numérica, así
los equivalentes no paramétricos:
Juan Bahamonde Sola
Página 7 de 11
Prueba paramétrica Prueba no paramétrica

t Student para muestras independientes U de Mann-Withney
t Student para muestras relacionadas Wilcoxon
ANOVA Inter sujetos (independientes) H Kruskal-Wallis
ANOVA Intra sujetos (relacionadas) Friedman
Para la correlación con r de Pearson, cuando relacionamos dos variables numéricas, su

equivalente no paramétrico es la correlación Ro de Spearman, cuando las variables no
cumplen el supuesto de normalidad y homocedasticidad.
Correlación No Paramétrica de Spearman (transversal):
Vamos a correlacionar el grado de estrés con los años de servicio que prestan a la institución.
Se ha medido el grado de stress laboral (ordinal) como alto, moderado y bajo y el tiempo de
servicio en años (numérica).
Debemos hallar n, media, desviación estándar y error típico o estándar de la media:
Analizar/comparar medias/medias…variable de estudio o lista de dependientes tenemos el

tiempo de servicios y como factor o lista de independientes, estrés laboral. En opciones
seleccionamos número de casos, media, desviación y Desv. error de la media
Juan Bahamonde Sola
Página 8 de 11
Edad cuantitativa Edad Cualitativa
Rho de Spearman calculamos con Análisis, correlaciones, bivariadas y seleccionamos Spearman

obteniendo los valores de rho y p-valor.
Juan Bahamonde Sola
Página 9 de 11
Siendo correlación baja podría haber otras variables que determinen el estrés laboral y no solo
el tiempo de servicio.
Juan Bahamonde Sola
Recopilación: UCE-2019 Página 10 de
11
Para el análisis de tablas de contingencia o cruzadas:
Para el análisis de tablas de contingencia o cruzadas:
Kappa de Kohen: mide la concordancia entre dos observadores sobre un mismo fenómeno, o
cuando un solo investigador evalúa con dos métodos o instrumentos diferentes (validez de
criterio) a un mismo fenómeno.
Coeficiente Phi y V de Cramer es una medida de asociación de variables nominales dicotómicas.

Si es politómica se usa el coeficiente de contingencia (es una extensión del Phi). Éstas miden la
fuerza de asociación entre las dos variables y estos coeficientes se interpretan así:
Primero debe demostrarse la asociación, es decir cuando p-valor está por debajo del nivel de
significancia y luego la fuerza de asociación.
Juan Bahamonde Sola
Recopilación: UCE-2019 Página 11 de
11
No confundir índice con coeficiente: el Riesgo Relativo y el ODDs Ratio son índices y el Kappa
de kohen es un coeficiente. Los coeficientes varían de 0 a 1 ( se pueden transformar a %) pero
los índices pueden valer más de 1 para considerarlos como significativos.
Cuando se tienen dos variables politómicas (categóricas), podemos usar la medida de

asociación V de Cramer.
Condiciones para realizar medidas de asociación: no hay muestra mínima para realizar
medidas de asociación. El riesgo relativo es una estimación puntual (es un número) que debe
ser acompañado de un Intervalo de Confianza al 95%. Mientras más grande es la muestra, más
corto es el IC y viceversa.
Coeficiente Gamma (similar al Rho de Spearman) es una medida de asociación para variables
ordinales. El coeficiente Rho de Spearman es una medida de asociación (correlación) de dos
variables ordinales (numéricas).
Tau-b de Kendall en correlaciones bivariadas de dos variables que tengan exactamente las
mismas categorías (leve moderado y severo), es un equivalente al Spearman (equivalente no
paramétrica del r de Pearson) es un coeficiente nativo para dos variables ordinales siendo ésta
la primera opción. La Tau-c de Kendall es aplicable cuando las categorías son diferentes y no
las mismas.
Lambda Simetrica&Asimétrica (da la dirección de la fuerza de la asociación). El coeficiente

Correlaciones (SPSS) se refiere a la r de Pearson. McNemar es un estadístico no un coeficiente.
Eta se utiliza cuando son variables numéricas (intervalo).
El análisis de correspondiente una variable con 4 categorías y otra con 5 categorías si p-valor es
significativo, entonces se hace análisis de correspondencia categoría por categoría (se trata de
dicotomización, por pares de categorías).

01 - Guía para El Análisis de Datos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

01 - Guía para El Análisis de Datos

Cargado por

Copyright:

Formatos disponibles

ANÁLISIS ESTADÍSTICO DE DATOS

Juan Bahamonde Sola

Análisis de datos de un Cuestionario con escala Likert.

Construcción de una escala

Si el cuestionario tiene 25 preguntas, Pmin=1, Pmax=5

Puntaje total mínimo: Tmin= 1 * 25 = 25

Puntaje total máximo: Tmax= 5 * 25 = 125

Rango (Tmax – Tmin): R=125-25 = 100

Amplitud del Intervalo (R/Pmax): A= 100/5 = 20

Valor Etiqueta desde hasta

N P1 P2 P3 P4 … P25 Total Valor Etiqueta

a = Amplitud de cada intervalo

N P1 P2 P3 P4 … P25 Total Percentil Etiqueta

Ejercicio de aplicación: Base de datos ExcelSPSS

3. Transformar/Agrupación Visual/Crear puntos de corte

Análisis de Contingencia o cruce de variables:

Sean estas características X y Y la muestra se divide en:

 Clase xi para la variable X

Se utiliza la prueba de chi-cuadrado para la independencia o asociación de variables

Criterios que deben ser considerados para seleccionar el estadístico de prueba:

1. Los tipos de investigación: transversal o longitudinal

X2 Cuadrado de homogeneidad: utilizamos cuando tenemos dos grupos y queremos

T de Student para muestras independientes: se utiliza cuando queremos comparar dos

Prueba paramétrica Prueba no paramétrica

Para la correlación con r de Pearson, cuando relacionamos dos variables numéricas, su

Correlación No Paramétrica de Spearman (transversal):

Debemos hallar n, media, desviación estándar y error típico o estándar de la media:

Analizar/comparar medias/medias…variable de estudio o lista de dependientes tenemos el

Edad cuantitativa Edad Cualitativa

Rho de Spearman calculamos con Análisis, correlaciones, bivariadas y seleccionamos Spearman

Para el análisis de tablas de contingencia o cruzadas:

Para el análisis de tablas de contingencia o cruzadas:

Coeficiente Phi y V de Cramer es una medida de asociación de variables nominales dicotómicas.

Cuando se tienen dos variables politómicas (categóricas), podemos usar la medida de

Lambda Simetrica&Asimétrica (da la dirección de la fuerza de la asociación). El coeficiente

También podría gustarte