Está en la página 1de 39

Introducción a la Estadística

Inferencial con SPSS

Juan José Igartua Perosanz


Universidad de Salamanca
jigartua@usal.es
Contenidos

1. Conceptos básicos de Estadística


Inferencial.
2. Tablas de contingencia.
3. Coeficiente de correlación de Pearson.
Conceptos básicos de Estadística
Inferencial

 Hipótesis nula y alternativa.


 Pruebas de contraste de hipótesis.
 Tipos de contraste de hipótesis.
 El concepto de significación estadística.
Contexto de la investigación
“Toma de decisiones bajo
Teorías y/o incertidumbre sobre lo adecuadas
investigaciones previas que son las explicaciones teóricas y
la hipótesis que se deducen de ellas”

Hipótesis de
Hipótesis alternativa (H1)
investigación

Diferencia-igualdad entre 2 ó más


grupos
Hipótesis estadística

Asociación entre 2 ó más


variables
Contexto de las pruebas de contraste de
hipótesis
Escepticismo (azar,
casualidad)

Pruebas de contraste Hipótesis nula (H0) versus


de hipótesis alternativa (H1)

Reglas de inferencia negativa Se da por supuesto que la hipótesis


nula es verdadera

Comprobar la validez de la Comparar H0 con H1


hipótesis estadística

Estadístico de contraste Significación estadística (p)


Reglas de inferencia negativa

“Las pruebas de contraste de hipótesis


tienen una presunción a favor de la
hipótesis nula (…), de forma similar a
como ocurre en los tribunales de
justicia, donde hay una presunción de
inocencia. Dado que uno es inocente
hasta que se demuestre lo contrario, la
evidencia aportada debe ser muy
consistente para admitir la culpabilidad”
(Baxter y Babbie, 2004, p. 278).

Páginas del manual 399-413


Significación estadística (p)

 ¿El azar explica los resultados?


 Probabilidad de equivocarse al rechazar la
hipótesis nula.
 Credibilidad de la H0.
 Probabilidad de error (error tipo I) al rechazar H0.
 Probabilidad de obtener un estadístico de
contraste tan grande como el obtenido si H0 fuera
cierta.
 La probabilidad de que las diferencias (o
asociación entre las variables) pueda explicarse
simplemente por el azar o la casualidad.
Tablas de contingencia

 Analizar la relación entre dos variables con un nivel


de medida nominal u ordinal (cualitativas).
 Comprobar si existen diferencias entre dos o más
grupos (variable columna, cualitativa) en una
variable (fila) cualitativa.
 Analizar la fuerza de la relación entre dos variables
cualitativas.
 Se toma como base una tabla de contingencia.
 Se calcula el estadístico de contraste Chi o Ji
cuadrado.
Cálculo del estadístico de contraste χ2

No existe relación entre 2 variables


Hipótesis nula
No existen diferencias entre los grupos en la
variable criterio

Existe asociación entre 2 variables


Hipótesis alternativa Existen diferencias entre los grupos en la
variable criterio

Fórmulas:

El nivel de significación asociado al estadístico ² representa la


Interpretación probabilidad de obtener un determinado valor de ² en el caso
Chi cuadrado: de que las dos variables sean independientes (hipótesis nula).
Cuando el valor obtenido sea menor que 0.05 (p<0.05) se podrá
rechazar la hipótesis nula y afirmar que existe una asociación
significativa entre las variables consideradas.
Calculo de las frecuencias esperadas y del
estadístico de contraste χ2 (ejemplo 1)
Cálculo de χ2 con SPSS (ejemplo 1)
Tabla de contingencia VotoPartido ¿Votó al partido político en las elecciones? * VioSpot
¿Vio el spot sobre la campaña del Partido Político? Tabla de
VioSpot ¿Vio el spot
sobre la campaña del
contingencia
Partido Político?
0 No 1 Sí Total
VotoPartido ¿Votó 0 No Recuento 10 10 20
al partido político Frecuencia esperada 10,0 10,0 20,0
en las elecciones? 1 Sí Recuento 10 10 20
Frecuencia esperada 10,0 10,0 20,0
Total Recuento 20 20 40
Frecuencia esperada 20,0 20,0 40,0

Pruebas de chi-cuadrado

Sig. as intótica Sig. ex act a Sig. ex act a


Valor gl (bilateral) (bilateral) (unilat eral)
Chi-cuadrado de P ears on ,000b 1 1,000
Chi Correc ción apor
continuidad
,000 1 1,000

cuadrado Razón de verosimilitudes ,000 1 1,000


Es tadístico ex acto de
1,000 ,624
Fis her
As ociación lineal por
,000 1 1,000
lineal
N de c asos válidos 40
a. Calculado sólo para una tabla de 2x2.
b. 0 c asillas (,0% ) tienen una frec uencia esperada inferior a 5. La frec uenc ia mínima esperada
es 10, 00.
Calculo de las frecuencias esperadas y del
estadístico de contraste χ2 (ejemplo 2)
Cálculo de χ2 con SPSS (ejemplo 2)
Tabla de contingencia VotoPartido ¿Votó al partido político en las elecciones? * VioSpot
¿Vio el spot sobre la campaña del Partido Político?

VioSpot ¿Vio el spot


sobre la campaña del Tabla de
Partido Político?
contingencia
0 No 1 Sí Total
VotoPartido ¿Votó 0 No Recuento 15 5 20
al partido político Frecuencia esperada 10,0 10,0 20,0
en las elecciones? 1 Sí Recuento 5 15 20
Frecuencia esperada 10,0 10,0 20,0
Total Recuento 20 20 40
Frecuencia esperada 20,0 20,0 40,0

Pruebas de chi-cuadrado

Sig. as intótica Sig. ex act a Sig. ex act a


Valor gl (bilateral) (bilateral) (unilat eral)
Chi-cuadrado de P ears on 10,000 b 1 ,002
Chi Correc ción apor
8,100 1 ,004
continuidad
cuadrado Razón de verosimilitudes 10,465 1 ,001
Es tadístico ex acto de
,004 ,002
Fis her
As ociación lineal por
9,750 1 ,002
lineal
N de c asos válidos 40
a. Calculado sólo para una tabla de 2x2.
b. 0 c asillas (,0% ) tienen una frec uencia esperada inferior a 5. La frec uenc ia mínima esperada
es 10, 00.
TABLAS DE CONTINGENCIA
(matriz de datos)
AC Latinoamerica
en prensa.sav

Estudio sobre el
tratamiento
informativo de
Latinoamérica en
la prensa
española

Metodología:
Análisis de
contenido (n=309
noticias)

Páginas del manual 524-525


Construcción de una tabla de contingencia
(paso 1)
Variable fila: VD
(carácter)

Variable columna:
VI (pais)

Menú Analizar > Estadísticos descriptivos >Tabla de Contingencia


Construcción de una tabla de contingencia
(paso 2)
Número de noticias sobre Chile y que aluden a
acontecimientos de carácter negativo (n=34)

Recuento

pais País protagonista de la información analizada


1 C hile 2 C uba 3 C olombia 4 México 5 Venezuela 6 Brasil Total
caracter Carácter 1 N egativo 34 22 26 14 24 14 134
(evaluativo) del
2 N eutro o ambiguo 44 14 7 17 7 5 94
acontecimiento
principal 3 Positiv o 13 19 10 15 10 14 81
Total 91 55 43 46 41 33 309

Número de noticias totales sobre Chile, Número de noticias que informan


independientemente del carácter de acontecimientos de carácter
evaluativo del acontecimiento principal negativo, independientemente
que se relata (n=91) del país protagonista (n=134)
Construcción de una tabla de contingencia
(paso 3)
Porcentajes
“columna”
Regla de Zeisel
Siempre que la
variable
“independiente”
aparezca como
variable
columna.
Construcción de una tabla de contingencia
(resultado final)
Se comparan los % entre las columnas.

% de pais País protagonista de la información analizada


pais País protagonista de la información analizada
1 Chile 2 Cuba 3 Colombia 4 México 5 Venezuela 6 Brasil Total
caracter Carácter 1 Negativo 37,4% 40,0% 60,5% 30,4% 58,5% 42,4% 43,4%
(evaluativo) del
2 Neutro o ambiguo 48,4% 25,5% 16,3% 37,0% 17,1% 15,2% 30,4%
acontecimiento
principal 3 Positiv o 14,3% 34,5% 23,3% 32,6% 24,4% 42,4% 26,2%
Total 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

El 60.5% de las noticias


¿Es estadísticamente
sobre Colombia son
significativa esta diferencia de
negativas, mientras que
porcentajes o se puede explicar
sólo lo son el 30.4% de las
por el azar?
noticias sobre México.
Obtención de frecuencias observadas, esperadas y
residuos en una tabla de contingencia
Se solicitan las
frecuencias
observadas,
esperadas y los
residuos no
tipificados
Tabla de contingencia con información sobre
frecuencias observadas, esperadas y residuos

pais País p rotagonista d e la info rmación analizada


1 Chile 2 Cuba 3 Colombia 4 México 5 Venezuela 6 Brasil Total
caracter 1 Negativo Recuento 34 22 26 14 24 14 134
Carácter Frecuencia esper ada 39,5 23,9 18,6 19,9 17,8 14,3 134,0
(evaluativo ) del Residuo -5,5 -1,9 7,4 -5,9 6,2 -,3
acontecimiento
2 Neutr o o ambiguo Recuento 44 14 7 17 7 5 94
princip al
Frecuencia esper ada 27,7 16,7 13,1 14,0 12,5 10,0 94,0
Residuo 16,3 -2,7 -6,1 3,0 -5,5 -5,0
3 Positivo Recuento 13 19 10 15 10 14 81
Frecuencia esper ada 23,9 14,4 11,3 12,1 10,7 8,7 81,0
Residuo -10,9 4,6 -1,3 2,9 -,7 5,3
Total Recuento 91 55 43 46 41 33 309
Frecuencia esper ada 91,0 55,0 43,0 46,0 41,0 33,0 309,0
Calculo MANUAL del estadístico de
contraste χ2
Calculo del estadístico de contraste χ2 con
SPSS
Botón
Estadísticos
Obtención del estadístico de contraste χ2
con SPSS (resultado final)
La prueba ² detecta si
existe una asociación
significativa entre las
variables.

Existe una relación


estadísticamente
significativa entre el
carácter evaluativo del
acontecimiento
principal abordado en
la noticia y el tipo de
país protagonista de la
misma [² (10, N=309)
= 36.83, p<.001]
Distribución χ 2 de Pearson
Tabla χ 2
Obtención de los residuos tipificados
corregidos

Permite saber
cuál es el
sentido de la
asociación o de
las diferencias
entre los grupos:
en este caso, qué
países de manera
significativa
difieren en el
tratamiento
informativo.
Obtención de los residuos tipificados
corregidos (resultado final)
pais País protagonista de la información analizada
1 C hile 2 C uba 3 C olombia 4 México 5 Venezuela 6 Brasil Total
caracter 1 N egativo Recuento 34 22 26 14 24 14 134
Carácter % de pais 37,4% 40,0% 60,5% 30,4% 58,5% 42,4% 43,4%
(ev aluativo) Residuo -5,5 -1,9 7,4 -5,9 6,2 -,3
del
Residuos tipificados -,9 -,4 1,7 -1,3 1,5 -,1
acontecimiento
principal Residuos corregidos -1,4 -,6 2,4 -1,9 2,1 -,1
2 N eutro o ambiguo Recuento 44 14 7 17 7 5 94
% de pais 48,4% 25,5% 16,3% 37,0% 17,1% 15,2% 30,4%
Residuo 16,3 -2,7 -6,1 3,0 -5,5 -5,0
Residuos tipificados 3,1 -,7 -1,7 ,8 -1,5 -1,6
Residuos corregidos 4,4 -,9 -2,2 1,0 -2,0 -2,0
3 Positiv o Recuento 13 19 10 15 10 14 81
% de pais 14,3% 34,5% 23,3% 32,6% 24,4% 42,4% 26,2%
Residuo -10,9 4,6 -1,3 2,9 -,7 5,3
Residuos tipificados -2,2 1,2 -,4 ,8 -,2 1,8
Residuos corregidos -3,1 1,5 -,5 1,1 -,3 2,2
Total Recuento 91 55 43 46 41 33 309
% de pais 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100%

Los residuos tipificados corregidos se considerarán estadísticamente


significativos los residuos cuyo valor sea mayor que 1.96 ó menor
que -1.96. El signo del residuo sirve para ver la dirección de la relación
entre las categorías de las variables implicadas.
Obtención de estadísticos para evaluar la
fuerza de la asociación
Obtención de estadísticos para evaluar la
fuerza de la asociación (resultado final)
Coeficiente de correlación r de Pearson

 Asociación lineal entre dos variables (de


intervalo o razón).
 Diagrama de dispersión.
 Covarianza (=sxy).
 Signo y fuerza de la asociación.
 Coeficiente de determinación (=r2) y varianza
explicada (=r2 x 100).
 Ojo! Correlación no es causación.
Cálculo MANUAL del coeficiente de
correlación de Pearson (2)
Signo: forma
de la relación
(+, -)

Valor numérico:
fuerza o magnitud
de la relación (-1,
+1)
Cálculo MANUAL del coeficiente de
correlación de Pearson (1)
9

8 9; 8

7 7; 7

5 4; 5
Y

3 2; 3

1 0; 1

0
0 2 4 6 8 10
X

Ecuación de la línea recta: y = a + bX


COEFICIENTE DE CORRELACIÓN DE
PEARSON (matriz de datos)
Encuesta TV y
violencia.sav

Estudio sobre
el efecto de
cultivo

Metodología:
Encuesta
(n=96)

Páginas del manual 508-509


Obtener un diagrama de dispersión
(paso 1)

Menú Gráficos > Dispersión/Puntos > Dispersión simple (Botón Definir)


Obtener un diagrama de dispersión
(paso 2)
Variable X: TV

Variable Y: victim
Obtener un diagrama de dispersión
(resultado final)

Relación positiva
entre X e Y

¿Pero de qué
magnitud es la
relación?
Cálculo del coeficiente de correlación de
Pearson (paso 1)

Menú Analizar > Correlaciones > Bivariadas


Cálculo del coeficiente de correlación de
Pearson (paso 2)
Cálculo del coeficiente de correlación de
Pearson (resultado final)
Ventana de
resultados

Correlación entre
consumo de TV y
victimización:

r[94]=0.53, p<.001

También podría gustarte