Está en la página 1de 79

CURSO SPSS BASICO

LECCIÓN 1
CREACIÓN DE MATRIZ DE DATOS
POBLACIÓN
• Definición 1: El conjunto de personas, animales o cosas que son
objeto de nuestro estudio.
• Definición 2: Es totalidad de las observaciones en las cuales se tiene
cierto interés.
• Cada miembro de la población debe tener al menos una característica
en común.
Elemento o Unidad Estadística:
• Son las personas, animales o cosas que forman la población.
• Si la población estuviera fueran todos los estudiantes de la
universidad cada estudiante sería un elemento o unidad estadística.
• Los elementos de una población poseen una serie de cualidades,
propiedades o rasgos comunes que se denominan en estadística
CARACTERES ó VARIABLES.
Ejemplo
En un estudio sobre personal de la se define como población a todos los
empleados de la municipalidad, estos empleados poseen una serie de
características:
• Edad.
• Estado civil.
• Número de hijos.
• Nivel de instrucción alcanzado.
• Antigüedad en el trabajo.
• Tarea que realiza.
• Remuneración que recibe.
• Etc.
Variables
• Son las características que tienen los miembros de la población.
• Es observable y pueden tomar diferentes valores, puede ser medido.
• Estas Características o Variables pueden tomar valores diferentes, en
el ejemplo anterior los miembros de la administración pública
podrían tener diferentes edades, diferentes estados civiles, etc.
Color de ojos, estado
Nominales civil, religión, sexo
Cualitativas
Nivel de instrucción,
Ordinales grado académico, nivel de
satisfacción
VARIABLES
Cantidad de
Discretas estudiantes, cantidad
Cuantitativas de hijos.

Continuas Peso, Estatura.


Escalas de Medición
En SPSS

Nominal Solo Clasificar Nominal

Ordinal Clasificar y
Variables Ordinal
Orden
Según su
escala de Clasificar, orden
medición Intervalo
Y distancia
Escala
Razón o Clasificar, orden,
Proporción Distancia y origen
Escala Nominal
• Una escala nominal o de clasificación consiste en clasificar objetos
reales según ciertas características, tipologías o nombres, “distinción”
dándoles una denominación o símbolo, sin que implique ninguna
relación de orden, distancia, o proporción entre esos objetos.

• Ejm: Sexo, Estado Civil, Color de cabello, color de ojos, etc.


Escala Ordinal
• Una escala ordinal consiste en clasificar objetos o individuos,
“distinción” según posiciones relativas en relación a una
característica, sin que se refleje distancia entre ellos, existe un
“orden” un sentido de mayor (>) y menor (<), también existen la
relación lógica de transitividad entre las categorías.
• Ejm: Nivel de instrucción, grado académico, nivel de satisfacción
respecto a un servicio, etc.
Escala de Intervalo
• Una escala de intervalo es una variable cuantitativa, es decir se mide de
forma numérica, al igual q los datos ordinales llevan inherente “distinción” y
“orden” entre sus valores, además se establecen intervalos iguales o
“distancias” entre las categorías a lo largo de toda la escala.
• El valor de 0 de la escala es arbitrario y convencional, por ello no indica
ausencia de lo q estamos midiendo, es decir no representa conceptos como
“ninguno”, “vacío” o “nada” la variable puede tomar el valor de cero e
incluso valores negativos.
• Ejm: Si la población son ciudades, temperatura del clima, diferencia horaria
en base a UTC, etc.
• Si la población son alumnos, calificación en Matemática, Puntos de
diferencia con respecto al promedio, etc.
Escala de Razón o Proporción
• Es una escala que además de “distinción”, “orden” y “distancia”
permite establecer en que “proporción” es mayor una categoría de la
escala que otra.
• Tiene un cero absoluto o natural que representa la nulidad de lo q se
estudia.
• Ejm: Peso, Talla, Ritmo cardiaco, número de hijos, etc.
CREACIÓN DE BASE DE DATOS
De un grupo de trabajadores de cierta empresa estatal se requiere obtener la
siguiente información.

1. Sexo
2. Estado Civil
a. Soltero
b. Casado
c. Divorciado
d. Viudo
3. Dirección de residencia
4. Nivel de Instrucción.
a. Primaria
b. Secundaria
c. Superior Técnica
d. Superior Universitaria
5. Edad
6. Ingresos Mensuales
DICCIONARIO DE DATOS
Nombre Tamaño Decimales Formato Etiqueta Tipo
p1 1 0 N Sexo Nominal
1 Masculino
2 Femenino
P2 1 0 N Estado Civil Nominal
1 Soltero
2 Casado
3 Divorciado
4 Viudo
P3 200 0 C Dirección de residencia Nominal
P4 1 0 N Nivel de Instrucción Ordinal
1 Primaria
2 Secundaria
3 Sup. Técnica
4 Sup. Universitaria
P5 2 0 N Edad Escala
P6 5 0 N Ingresos Mensuales Escala
LECCIÓN 2
CREACIÓN DE MATRIZ DE DATOS DESDE
CUESTIONARIO
CUESTIONARIO
• Un cuestionario o formulario es, por definición, un instrumento de
recopilación de datos, adecuadamente estandarizado, que traduce de
manera concreta los objetivos de la investigación.
• Usualmente está conformado por una serie de preguntas diseñadas y
organizadas para obtener información acerca de un sujeto o un tópico
a través de un informante o entrevistado (unidad estadística).
TIPOS DE PREGUNTAS DE ACUERDO AL TIPO
DE VARIABLE.
Tipos de Variables Tipo de Preguntas
Nominales Dicotómicas Cerradas
Cerradas
Semicerradas
Nominales Politómicas Abiertas
Mixtas o Semiabiertas
No excluyentes o de respuesta múltiple
Cerradas
De tipo Likert
Ordinales
De Evaluación o Valoración
De Ordenamientos
Cuantitativas Abiertas
VARIABLES NOMINALES DICOTÓMICAS
Se utilizan generalmente preguntas cerradas
Sexo
( ) Masculino
( X ) Femenino
VARIABLES NOMINALES POLITÓMICAS
Se utilizan varios tipos de preguntas ¿Cuál es pasatiempo favorito?
Cerradas Visitar el Zoológico
¿Cuál es el área de su profesión? ………..…………..……
( ) Ciencias de la Salud
( ) Ciencias Sociales Mixtas o Semiabiertas
( X ) Ingenierías ¿Ha llevado algún curso virtual en otra plataforma
educativa?
Semicerradas ( X ) Ninguno
¿Cuál es su actual país de residencia? ( ) Si, ¿Sitio web de dicha plataforma?
( ) Perú …………………
( ) México
( X ) Argentina No excluyentes o de respuesta múltiple
( ) España ¿Además del español cuales de los siguientes idiomas
( ) Otro………………………………. habla usted?
( X ) Inglés
Abiertas ( ) Francés
¿Cuál es su deporte favorito? ( X ) Portugués
Tenis ( ) Italiano
………..…………..…….
VARIABLES ORDINALES
Cerradas De Evaluación o valoración
¿Cuál es su grado académico? Valore del 1 al 10 la calidad del material brindado
( ) Pregrado durante el curso, donde 1 representa la máxima
( X ) Bachiller insatisfacción y 10 la máxima satisfacción
( ) Maestría 1 2 3 4 5 6 7 8 9 10
( ) Doctorado Calidad del material

De tipo Likert De Ordenamiento


¿Qué tan satisfecho está usted con el curso virtual que De acuerdo a su criterio ordenar por prioridad los
llevó? siguientes aspectos en un curso virtual escribiendo
( ) Muy Satisfecho “1” para el de mayor prioridad, “2” para el segundo
( X ) Satisfecho de mayor prioridad y así sucesivamente.
( ) Ni Satisfecho ni Insatisfecho
( ) Insatisfecho (1) Didáctica del docente
( ) Muy Insatisfecho (4) Contenido del curso
(3) Atiende a dudas y consultas
(2) Material bibliográfico
VARIABLES CUANTITATIVAS
Abiertas
Fecha en q inicio su primer curso.
15-5-2019
………..…………..

¿A cuánto ascienden sus Ingresos mensuales?


3500
…………………….
LECCIÓN 3
ELABORACIÓN DE TABLAS DE FRECUENCIAS,
ESTADISTICOS
Describir variables
Variables de Escala Nominal
• Tablas de frecuencias
• Gráfico de barras o circular
Variables de escala Ordinal
• Tablas de frecuencias
• Gráfico de barras
Variables de escala de Intervalo o de Razón
• Estadísticos
• Histograma
Variable Nominal
Variable Ordinal
Variable de escala de Intervalo o Razón
LECCIÓN 4
HERRAMIENTAS PARA MANEJO DE DATOS
ORDENAR
• Ordenar casos consiste en cambiar el orden de los casos (es decir, el
orden de las filas del Editor de datos) utilizando como criterio una o
más variables. puede resultar útil, por ejemplo, si se desea imprimir el
archivo de datos con los casos ordenados siguiendo algún criterio de
interés.
• Ejemplo1: Ordenar a las personas de acuerdo a la Edad.
• Ejemplo2 Ordenar a las personas de acuerdo al genero y luego de
acuerdo al grado académico.
SEGMENTAR
• Segmentar un archivo consiste dividirlo en subgrupos. Los análisis
estadísticos que se llevan a cabo mientras un archivo se encuentra
segmentado se repiten para cada grupo resultando de la
segmentación
• Por ejemplo podemos describir la variables Estatura y Peso
diferenciando varones y mujeres.
SELECCIONAR CASOS
• Nos sirve para filtrar, para tomar en cuenta solo ciertos casos de toda la
base de datos q cumplan cierta condición, también podemos analizar una
muestra aleatoria del total de casos del archivo de datos.
• Por ejemplo podríamos describir el Peso solo para quienes tengan una
Edad superior a los 40 años.
• Ejemplo 2: Obtener Estadísticos de la variable Peso, pero solo para aquellos
personas que estén entre los 30 y 45 años.
• Ejemplo 3: Obtener estadísticos de la variable Peso, solo para las mujeres
de la rama de Ciencias de la Salud.
• Ejemplo 4 Obtener estadísticos de la variable Peso, solo para las personas
que pertenezcan a las ramas de Ciencias de la Salud e Ingenierías.
LECCIÓN 5
HERRAMIENTAS PARA CALCULAR Y CATEGORIZAR
VARIABLES
Herramientas para categorizar datos
• Recodificar en distintas variables
• Agrupación visual
Ejemplo1
• Categorizar la edad de la siguiente manera

Etapa Edad
Joven Menos de 30 años
Adulto De 30 a 59 años
Anciano De 60 años a más
Ejemplo 2
• Categorizar la ciudad en Regiones

Ciudad Región
Lima(46) Lima (1)
Trujillo (22), Ica(23), Chiclayo(28), Piura(30),
Costa (2)
Tacna(35)
Arequipa(12), Puno(13), Moquegua(14), Ancash(24),
Junín(37), Cerro de Pasco(43), Ayacucho(44), Sierra (3)
Apurímac(48), Cajamarca(49), Huánuco(50)
Pucallpa(11), Bagua(29), Iquitos(52) Selva (4)
Ejemplo 3
• Categorizar el puntaje en Orientación Espacial en las siguientes tres
categorías de Condición

Puntaje Orientación Espacial Condición


< 35 Bajo
>= 35, < 60 Regular
>= 60 Bueno
Calcular variable
• Calcular el IMC según:
𝐏𝐞𝐬𝐨
𝐈𝐌𝐂 =
𝐓𝐚𝐥𝐥𝐚𝟐

• Categorizar el IMC según


Índice de Masa Estado
Corporal Nutricional
< 18,5 Desnutrición
>=18,5 < 25 Normal
>=25 Sobrepeso
LECCIÓN 6
ANÁLISIS DESCRIPTIVO
ANÁLISIS DESCRIPTIVO
• Una de las principales funciones de la estadística consiste en la
descripción de los datos; ya sea por medio de tablas, gráficos o
medidas (estimadores) que permitan apreciar claramente el
comportamiento y las tendencias de la información recopilada. SPSS
cuenta con una serie de procedimientos para realizar esta labor, cada
uno de los cuales nos ofrece diversas posibilidades y su aplicación
depende de las características de la información que contenga cada
variable.
Variable Nominal
Variable Ordinal
Variable de escala de Intervalo o Razón
Tabla de Frecuencias Agrupada Histograma
Medidas
• Medidas de Tendencia Central
• Medidas de Tendencia no Central
• Medidas de Dispersión
• Medidas de Forma
Medidas de Tendencia Central
• Media Aritmética
Entre las ventajas están que tiene, es q intervienen todos los valores de la variable,
es única, es calculable y es el centro de gravedad de la distribución. Como
desventaja es q está afectada por los valores extremos que presentan los datos lo q
puede originar q a veces las conclusiones no sean muy atinadas.
• Mediana
La mediana divide las observaciones en dos partes iguales. Es aquel valor de la
variable calculada de tal forma q el 50% de los datos sea igual a ella o menor.
• Moda
Es el valor que mas se repite.
Medidas de Tendencia no Central o de Orden
• Cuartiles
Los cuartiles dividen la distribución de datos u observaciones en cuatro
partes iguales, tenemos tres cuartiles Q1, Q2 y Q3 y en cada uno se
encuentra el 25 % del total de casos observados.
• Percentiles
La percentiles dividen las observaciones en 100 partes iguales. Es decir
que en todos los casos que usamos 4 debemos usar 100.
Medidas de Dispersión
• Rango, Amplitud o Recorrido
Nos muestra que tantos valores abarca la variable.
• Rango Intercuartil
Considera la dispersión de la mitad (parte central) de los datos, por lo tanto,
no se ve afectada por los valores extremos. Es una buena medida de
dispersión cuando los datos están representados por la mediana.
• Desviación Estándar
La desviación estándar mide la dispersión promedio alrededor de la media:
como fluctúan las observaciones mayores arriba de ella y las observaciones
menores debajo de ella.
Medidas de Dispersión
• Desviación Estándar
El 68,0% de los datos se encuentran entre la media más menos 1 desviación estándar.
El 95,0% de los datos se encuentran entre la media más menos 2 desviaciones estándar.
El 99,0% de los datos se encuentran entre la media más menos 3 desviaciones estándar.
• Coeficiente de Variación
Puede usarse para comparar distribuciones en diferentes unidades de medidas, y poder
decir de ellas cual es más homogénea en sus datos respecto a la media.
CV Grado de Dispersión
< 10% Poca Dispersión
>= 10% , <34% Aceptable
>= 34% , <50% Alta Dispersión
>= 50% Muy Alta
Medidas de Forma
• Coeficiente de Asimetría
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética)

g1 < 0 g1 = 0 g1 > 0
Asimétrica Negativa Simétrica Asimétrica Positiva
Moda > Media > Mediana Moda = Media = Mediana Moda < Media < Mediana
Medidas de Forma
• Coeficiente de Curtosis
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética)

g2 < 0 g1 = 0 g1 > 0
Platicúrtica Mesocúrtica Leptocúrtica
Distribución dispersa Distribución concentrada
LECCIÓN 7
ANÁLISIS EXPLORATORIO DE DATOS
Análisis Exploratorio de Datos
• Es un conjunto de técnicas estadísticas cuya finalidad es conseguir un
entendimiento básico de los datos y de las posibles relaciones
existentes entre las variables analizadas.
• El análisis exploratorio tiene el mismo objetivo que el análisis
descriptivo, pero además se busca detectar anomalías o errores en las
distribuciones de los datos, también se intenta descubrir patrones de
comportamiento en los datos.
Objetivo del AED
• Preparar y organizar los datos (Análisis descriptivo)
• Detectar fallos en el diseño y recogida de los mismos (Diagrama de tallos y
hojas, diagrama de cajas y bigotes)
• Tratamiento y evaluación de datos ausentes (omitir variables, omitir casos
e imputación).
• Identificación de casos atípicos (diagrama de cajas y bigotes).
• Comprobación de los supuestos subyacentes en la mayor parte de las
técnicas multivariantes (normalidad, linealidad, homocedasticidad).
Diagrama de tallos y hojas.
Frecuencia Tallo Hojas
2 2 19
2 3 47
4 4 2679
3 5 579
10 6 0456788999
7 7 0344557
8 8 11126777
4 9 0147
Ancho del tallo: 10
Cada hoja: 1 caso
• Hay 2 alumnos con notas de 21 a 29, de ellos uno tiene 21 y otro 29.
• Hay 2 alumnos con notas de 34 a 37, de ellos uno tiene 34 y otro 37.
• Hay 4 alumnos con notas de 42 a 49, de ellos uno tiene 42, uno 46, uno 47 y uno 49.
Diagrama de Cajas y Bigotes.
• Un diagrama de caja es un
resumen gráfico de los datos
basado en cinco datos y nos da
una idea de forma de la
distribución de los datos, además
de poder determinar si tenemos
valores atípicos.
• Son valores atípicos los q se
muestren fuera de los bigotes.
Diagrama de cajas y Asimetría

Asimétrica Simétrica Asimétrica


negativa positiva
Diagrama de cajas y Curtosis

Platicúrtica Mesocúrtica Leptocúrtica


Diagrama de Barras de Error
• Las barras de error son
representaciones gráficas de la
variabilidad de los datos, y se
usan en gráficos para indicar el
error o la incertidumbre en
una determinada medida,
como ejemplo mostraremos la
media.
Media recortada
• Se denomina media truncada a una medida de tendencia central estadística,
similar a un promedio y una mediana. Para el cálculo del promedio en este caso
previamente se descartan porciones de la muestra en el extremo inferior y
superior, típicamente se descarta igual cantidad en ambos extremos.
• En este caso calcularemos la media recortada al 5%, es decir no se consideran el
5% de los valores menores, ni el 5% de valores mayores, solo se obtiene el
promedio del 90% de los casos.

90%

5% 5%
LECCIÓN 8
ANÁLISIS DE CORRELACIÓN Y REGRESIÓN
Asociación entre variables
• La existencia de algún tipo de asociación entre dos o más variables
representa la presencia de algún tipo de tendencia o patrón de
emparejamiento entre los distintos valores de esas variables.

• El análisis estadístico de la asociación (relación, correlación,


covarianza) entre variables representa una parte básica del análisis de
datos en cuanto que muchas de las preguntas e hipótesis que se
plantean en los estudios que se llevan a cabo en la práctica implican
analizar la existencia de asociación entre variables.
CORRELACIÓN

ASOCIACIÓN
RELACIÓN

• Asociación: Es la presencia de algún tipo de tendencia o patrón de emparejamiento


entre los distintos valores de dos o más variables.
• Correlación: Es una instancia especifica de la asociación, cuando las variables son
como mínimo de escala ordinal (ordinal, intervalo, razón), la correlación se da en
una dirección (sentido) ya sea directa o inversa.
• Relación: Es la asociación entre variables categóricas (nominales u ordinales)
Pasos para determinar si hay correlación

1. Obtener diagrama de dispersión/cajas/tabla cruzada


2. Obtener el coeficiente de correlación
3. Determinar si la correlación es significativa
4. Describir la correlación.
Diagrama de dispersión
• La forma más directa e intuitiva de formarnos una primera impresión
sobre el tipo de relación existente entre dos variables es a través de
un diagrama de dispersión. Un diagrama de dispersión es un gráfico
en el que una de las variables (Xi) se coloca en el eje de abscisas
(horizontal), la otra (Yi) en el de ordenadas (vertical) y los pares (xi, yi)
se representan como una nube de puntos. La forma de la nube de
puntos nos informa sobre el tipo de relación existente entre las
variables.
Diagrama de cajas
• En caso la variable independiente sea de escala ordinal y las variables
dependientes de escala intervalo o razón se puede obtener también
un diagrama de cajas, con la variable independiente en las categorías
(generalmente en el eje horizontal) y la dependiente como valores del
diagrama de cajas, este diagrama nos permite una mejor visualización
del comportamiento de los datos.
Tabla cruzada
• En caso ambas variables sean de escala ordinal se puede usar una
tabla de cruzada (tabla de contingencia), en ella ubicaremos la
variable independiente en las filas y la variable dependiente en las
columnas, acompañaremos la tabla con valores porcentuales,
porcentajes por filas.
Coeficiente de Correlación
• Coeficiente de correlación R de Pearson
• Coeficiente de correlación Rho de Spearman
• Coeficiente de correlación Tau-b de Kendal
Coeficiente de Correlación

Casos Coeficiente de Correlación


Entre 2 Variables de escala de
R de Pearson.
Intervalo o Razón
Entre Una variable de escala de
intervalo/razón con una Rho de Spearman
variable ordinal
Entre 2 Variables de escala Rho de Spearman
Ordinal o Tau-b de Kendall
Coeficiente de Correlación
Coeficiente de R de Pearson Sentido de Correlación
Grado de Correlación
Correlación + Directa
1 Perfecta
– Inversa
0.8 – 1 Muy Fuerte
0.6 – 0.8 Fuerte
0.4 – 0.6 Moderada
0.2 – 0.4 Débil
0 – 0.2 Muy Débil
0 Nula
Correlación Directa
• Si la correlación es directa
quiere decir q mientras la
variable independiente (X)
aumenta su valor la variable
dependiente (Y) también
aumenta su valor.
Correlación Inversa
• Si la correlación es inversa
quiere decir q mientras la
variable independiente (X)
aumenta su valor la variable
dependiente (Y) reduce su
valor.
Determinar si la correlación es significativa
Nivel de significancia (α): Es el máximo error que estaremos dispuestos a aceptar, es un
valor que no se calcula sino más bien se establece. Por lo general se utilizan:
α = 0.05 (5%) para las ciencias sociales.
α = 0.01 (1%) para algunos casos de las ciencias médicas.
Intervalo de Confianza (1- α): O Nivel de confianza, es el complemento del nivel de
significancia.
Si α = 0.05 (5%) -> El intervalo de confianza será 0.95 (95%)
Si α = 0.01 (1%) -> El intervalo de confianza será 0.99 (99%)
P-valor: Es el error real que se comete al afirmar q existe correlación entre las dos
variables.
Regla de decisión
Hipótesis
H0: La correlación NO es significativa.
H1: La correlación SI es significativa.
Regla de decisión
P-valor > α -> se acepta H0
P-valor < α -> Se rechaza H0 y se acepta H1
Modelo de Regresión
• Modelo de Regresión: Es un modelo matemático (ecuación) que describe la
relación entre las dos variables independiente y dependiente. Existen varios
modelos, podemos agruparlos en principalmente dos tipos:
• Modelo de Regresión Lineal: Cuando el modelo matemático es una ecuación
lineal, tiene la siguiente forma.
𝑌: 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑋: 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑌 = 𝑎 + 𝑏𝑥
• Coeficiente de Determinación(R2): Es un índice q muestra en q magnitud se
puede explicar el comportamiento de la variable dependiente según la variable
independiente. Indica también en q magnitud se ajustan los datos a un modelo.
LECCIÓN 9
ANÁLISIS DE DATOS CATEGORICOS
Tabla de Contingencia
• Tabla de contingencia o tabla cruzada o tabla de doble entrada, nos permite
analizar la distribución de una variable con relación a otra, esta tabla conviene
acompañarla con valores porcentuales calculados por columnas, por filas o
totales.
Variable Independiente
Variable
Categoría 1 Categoría 2 Total
Dependiente
Categoría 1 a b =a+b
Categoría 2 c d =c+d
Total =a+c =b+d =a+b+c+d
Ejemplo

Para saber si hay relación entre las variables se comparan los valores observados con los esperados

Valores Observados Valores Esperados


Enfermedad Enfermedad
Factor de Factor de
Riesgo Si No Total Riesgo Si No Total
Expuestos 15 45 60 VS Expuestos 20 40 60
No expuestos 85 155 240 No expuestos 80 160 240
Total 100 200 300 Total 100 200 300
Prueba de independencia de Chi2 de Pearson.
Las pruebas de significación estadística que acompañan el análisis basan su examen
en comparar los resultados observados con los esperados (bajo el supuesto de que
no hay asociación). El estadístico que mide la diferencia entre los valores
observados y los esperados es el Chi2 de Pearson, cuanto mayor sea la diferencia
entre la distribución observada y la esperada, menos razonable es suponer que la
distribución observada sea solo producto del azar, este estadístico Chi2 de Pearson
viene acompañado por un p-valor el cual utilizaremos para contrastar la hipótesis si
las variables están relacionadas o no.
H0: Las variables son independientes.
H1: Las variables NO son independientes.
Regla de decisión
Si p-valor > α Se acepta H0
Si p-valor < α Se rechaza H0 y se acepta H1

También podría gustarte