UNIVERSIDAD COOPERATIVA DE COLOMBIA SEDE BOGOTA
FACULTAD DE CONTADURIA PÚBLICA
FORMATO PARA EL DISEÑO DE GUÍAS DE TRABAJO
ASIGNATURA: Estadística Descriptiva, Estadística Inferencial y Econometría.
ELABORADO POR: Emiro Alberto Pertuz De Oro.
FECHA: JUNIO de 2020.
1. TEMA: Guía para la aplicación del paquete estadístico SPSS-25.
2. OBJETIVO: Dar una herramienta operativa a los estudiantes en el manejo
del SPSS-25 para las aplicaciones en Estadística Descriptiva, Estadística
Inferencial y para Econometría.
3. COMPETENCIAS A DESARROLLAR:
3.1. Manejo de conceptos.
El estudiante debe conocer los diferentes tipos de archivos que puede
utilizar del SPSS.
Identifica los tipos de ventanas del SPSS: de salida, de edición, de
gráficos y de sintaxis.
Aprende a utilizar los principales comandos del paquete estadístico SPSS.
3.2. Conocimiento de procesos.
Importa bases de datos y crea bases de datos en el paquete estadístico
SPSS que incluyen diferentes tipos de variables, tanto cualitativas como
cuantitativas. También incorpora al SPSS base de datos guardada en
archivos de Excel.
Codifica las variables cualitativas en el paquete estadístico SPSS 25 y otras
versiones.
Asigna las escalas de medición de acuerdo al tipo de variable incorporada
en la base de datos.
3.3. Nivel actitudinal.
Desarrolla ejercicios en grupo utilizando el SPSS 25.
Trabaja adecuadamente de manera individual y grupal, en el análisis de
resultados.
Participa activamente en las actividades propuestas en el laboratorio con
SPSS 25.
Tabla de contenidos
1. Marco conceptual
2. Operatividad
3. Tipos de ventanas en el SPSS
4. Contenido de Vista de variable
5. Contenido de vista de datos.
6. Creación de base de datos nueva o existente.
Introducción
El paquete estadístico SPSS (Statistical Presentation Software Systems) es un
paquete estadístico útil para el proceso del manejo de la información Estadística,
que utilizan los diferentes profesionales, especialmente académicos e
investigadores. El paquete SPSS fue creado en ambiente Windows, lo que permite
abrir varios tipos de ventanas y además varios tipos de archivos, con un fichero
para la vista de variables y vista de datos similar a la hoja del Excel.
Los tipos de archivos que se manejan en el paquete SPSS son:
1. Datos con extensión. sav
2. Los resultados: con extensión .sps
3. Los gráficos: con extensión. cht
Propósito del curso y competencias
Aplicación de TICs en el aula, para motivar al estudiante a desarrollar estudios de
casos como forma práctica en el desarrollo de los contenidos, para medir la
competencia que se busca.
Contenidos temáticos
1. Conceptos generales de la terminología a utilizar
2. Definición de archivos
3. Vista de variables y vista de datos.
4. Como crear una base de datos en SPSS o como importarla.
5. Como transformar variables.
6. Comandos de operaciones estadísticas y gráficos.
Recomendaciones prácticas sobre las notas de clase
Aplicar paso a paso los conceptos y temáticas del SPSS, en casos prácticos para
analizar resultados.
Unidades
La primera Unidad define la conceptualización y bondades del SPSS 25. Se busca
motivar al estudiante en el aprendizaje del manejo del paquete estadístico, en
versiones más recientes.
Contenidos a desarrollar:
1. Las ventanas que se manejan en el SPSS son:
Hay una Ventana de aplicación (SPSS application Windows). Esta contiene
los menús para las aplicaciones del programa SPSS.
La ventana de Salida de resultados (Output Windows). En esta ventana
aparecen los resultados con los todos los análisis que se realizan en las
instrucciones dadas. Se abre a partir del primer análisis, y los demás
análisis se van colocando en forma secuencial en la parte inferior, puede
ser archivada para ser utilizada posteriormente.
La ventana de edición de los datos (Data editor Windows) Esta ventana
contiene el archivo de los datos que se están trabajando. Pueden crearse
archivos que serán utilizados posteriormente para
Hay una ventana conocida como Carrusel de gráficos (Chart Carrusel
Windows) En esa ventana se van presentando los diferentes gráficos
solicitados. Se activa a partir de la solicitud que se haga de algún gráfico.
La ventana de los gráficos (Chart Windows) En esa ventana se podrá
modificar los gráficos, títulos, escalas en los ejes y archivar gráficos en
archivos extensión. cht.
La ventana de la sintaxis (Syntax Windows) Esta ventana nos permite pegar
la sintaxis de los comandos seleccionados, puede ser editada y ampliada
con opciones del SPSS que no están en la barra del menú. Se puede
guardar y utilizarse en futuros análisis.
2. Archivos.
Cuando se inicia la sesión del SPSS, en la pantalla aparece una ventana
que permite abrir archivos ya existentes o crear uno nuevo. Si se elige crear
un archivo nuevo, se abre la ventana de edición, en la cual podemos crear
la base de datos a partir de la cual se harán los análisis estadísticos.
Las bases de datos se construyen asignando una columna a cada variable
que se quiera analizar, de manera que los sujetos están situados en las
filas, en consecuencia, la base tendrá tantas columnas como variables y
sujetos para analizar.
El paquete maneja dos sub ventanas, una de datos (Vista de datos) y una
de variables (Vista de variables).
3. En la parte inferior de la hoja de cálculo(fichero), al elegir la ventana de
vista de variables se presenta una matriz donde en las filas se crean las
variables y en las columnas las características de las variables, dentro de la
matriz se coloca el nombre de la variable sin utilizar puntos, comas, guiones
o símbolos que puedan generar incompatibilidad con las instrucciones del
software (Max. 8 caracteres), tipo de variable (si es cuantitativa o
cualitativa), etiqueta, etiqueta de valor (codificar variables cualitativas),
ancho de columna, decimales y demás características, Una vez se creen
las variables, se ubica la ventana de datos y se entran los resultados de los
sujetos correspondientes a cada una de las variables.
Contenido de la ventana Vista de variables:
4. Nombre: Si no es posible colocar el nombre completo, se puede resumir
(abreviatura), pero no se debe utilizar puntos, signos, dejar espacios, etc.
Se puede utilizar barra al piso entre palabras (_). No tiene en cuenta las
mayúsculas.
En esta parte la unidad debe desarrollarse claramente tema por tema. La
explicación de cada tema debe estar acompañada de gráficos, recursos didácticos
o de análisis de lecturas complementarias que ayuden al estudiante a profundizar.
No se incluirán gráficos que no sean constructivos para la argumentación, es
decir, que no aporten datos que justifiquen su presentación en el texto.
Los gráficos pueden ser en policromía (a color), pero la imagen debe tener buena
resolución. No se aceptarán imágenes que no tengan permiso para su
reproducción.
Tipo: existen varios tipos de variables. Los tipos más utilizados son: numérico
(cuantitativas) y las de tipo Cadena (cualitativas). Sin embargo, en versiones
posteriores a la 15.0 es preferible trabajar todas las variables como numéricas
para evitar inconvenientes en los cruces de variables.
Anchura: Hace referencia al número máximo de caracteres o de espacios a
utilizar en la inclusión de los datos, esto incluyendo el punto decimal. Por lo
general se dejan 8 que por defecto utiliza el paquete. La versión 23 del SPSS
asigna 12.
Decimales: se refiere al número de decimales que tienen los datos de la variable
que se va a ingresar.
Etiqueta: la etiqueta es opcional. Se refiere al nombre completo de la variable. Es
útil cuando se ha hecho un resumen o abreviatura del nombre de la variable. En la
etiqueta se puede utilizar el nombre completo de la variable o hacer aclaraciones
acerca de ella. Por ejemplo, si en el nombre se colocó como nombre de variable
“promedio”, en la etiqueta puede colocarse: Promedio académico de los
estudiantes. Por ej.
Valores: se utiliza para determinar las etiquetas de los valores de las variables
cualitativas que se han creado como numéricas. Por ejemplo, si se ha creado la
variable “Sexo”, con valores 1 y 2, al activar valores, aparece el cuadro de diálogo
de las etiquetas de valor, dar en valor el número 1 y en etiqueta Femenino, luego
añadir, a continuación, escribir 2 en valor y Masculino en etiqueta de valor y
añadir. Una vez se termine de dar los valores y etiqueta, accionar continuar. Esto
permite asignar a la variable género en la ventana de datos valores de 1 o 2 según
el caso, en lugar de escribir femenino o masculino.
Importar base de datos.
Al iniciar la sesión del SPSS, aparece en pantalla una ventana que permite abrir
archivos ya existentes o crear uno nuevo. Al elegir crear un nuevo archivo, se abre
la ventana de edición, en la cual podemos crear la base de datos a partir de la cual
se harán los análisis estadísticos.
Las bases de datos se construyen tomando una columna para cada variable que
se desee analizar, de manera que los sujetos están situados en las filas, por tanto,
la base tendrá tantas columnas como variables y tantas filas como sujetos.
PRESENTACION:
En la versión 25, el paquete SPSS maneja dos sub ventanas, una de datos (Vista
de datos) y una de variables (Vista de variables).
Contenido de la ventana Vista de variables:
Nombre: Se sugiere un máximo 8 caracteres, no permite comenzar un nombre de
variable con números ni colocar espacios. Si no es posible colocar el nombre
completo, se puede resumir (abreviatura) o utilizar barra al piso entre palabras. No
tiene en cuenta las mayúsculas.
Tipo: existen varios tipos de variables. Los tipos más utilizados son: numérico
(cuantitativas) y Tipo de Cadena (cualitativas). Sin embargo, en versiones
posteriores a la 15.0 es preferible trabajar todas las variables como numéricas
para evitar inconvenientes en los cruces de variables.
Anchura: se refiere al número máximo de caracteres o espacios a utilizar en la
inclusión de los datos, incluyendo el punto decimal. Puede dejarse el 8 que por
defecto utiliza el paquete. La versión 23 del SPSS asigna 12.
Decimales: se refiere al número de decimales que tienen los datos de la variable
que se va a ingresar.
Etiqueta: la etiqueta es opcional. Se refiere al nombre completo de la variable. Es
útil cuando se ha hecho un resumen o abreviatura del nombre de la variable. En la
etiqueta se puede utilizar el nombre completo de la variable o hacer aclaraciones
acerca de ella. Por ejemplo, si en el nombre se colocó como nombre de variable
“promedio”, en la etiqueta puede colocarse: Promedio académico de los
estudiantes. Por ej.
Valores: se utiliza para determinar las etiquetas de los valores de las variables
cualitativas que se han creado como numéricas. Por ejemplo, si se ha creado la
variable género(Sexo), con valores 1 y 2, al activar valores, aparece el cuadro de
diálogo de las etiquetas de valor, dar en valor el número 1 y en etiqueta Hombre,
luego añadir, a continuación, escribir 2 en valor y Mujer en etiqueta de valor y
añadir. Una vez se termine de dar los valores y etiqueta, accionar continuar. Esto
permite asignar a la variable género(sexo) en la ventana de datos valores de 1 o 2
según el caso, en lugar de escribir Hombre o Mujer.
Valores perdidos. Cuando falta algún dato de la variable, el SPSS lo asume
como valores perdidos. También se utiliza cuando el encuestado no quiere
responder la pregunta, por ejemplo, “Sexo”, entonces se habilita un número para
representar esa respuesta en la variable cualitativa, se utiliza generalmente el
número 9 como valor perdido discreto.
El siguiente paso es identificar en los “valores” de la etiqueta ese nuevo código,
luego añadir y aceptar. Cerrar.
Medida. Se coloca la escala de medición de las variables, si la variable es
cuantitativa el SPSS la identifica como “numérica” y en medida se coloca “Escala”
que referencia escala de razón e intervalo. Si la variable es cualitativa entonces es
“tipo” aparece cadena y en medida, nominal u ordinal.
Vista de variables.
Vista de datos.
Los valores de las variables cualitativas se cargan de la siguiente forma: en valor
se le da el numero correspondiente, la etiqueta y añadir, posteriormente aceptar.
Este proceso se aplica a todas las variables cualitativas.
Ver proceso para la variable sexo: valor 1, etiqueta Hombre cargar con “Añadir”
Continuacion de la etiqueta de la variable sexo. Cargadas todas las etiquetas se le
dice “Aceptar” para que el SPSS identifique adecuadamente los valores de la
variable cualitativa.
Otro ejemplo para cargar las etiquetas de la variable cualitativa“tipo de consulta”:
Otro ejemplo para una variable tipo LIKERT, variable cualitativa. Con 5 niveles de
respuesta a saber: Totalmente en desacuerdo, en desacuerdo, ni de acuerdo ni en
desacuerdo, de acuerdo y totalmente de acuerdo. Variable “Opinión del estado de
las habitaciones”, se toman para etiquetar la variable valores consecutivos de 1 a
5.
Funciones del SPSS.
Archivo: se crean archivos, se importan datos, se crean base de datos y se
ingresa base de dato de otro archivo (ver imagen).
Editar: se utiliza para rehacer y deshacer informes de variables, buscar
casos y variables.
Ver: con esta instrucción cambiar la presentacion de la base de datos. Se le
pueden suprimir las cuadriculas del visor de datos y variables, colocar las
etiquetas(nombres) a los codigos de los valores de las variables
cualitativas.
Datos: entre otras funciones con este comando se puede definir las
unidades de las series de tiempo, datos mensuales, bimestrales,
trimestrales, anuales y diarios. Segmentar casos, comparar datos.
Transformar: se crean nuevas variables con algunas operaciones
aplicadas, se recodifican variables, se agrupan datos de variables con
“agrupación visual”, se crean intervalos. También se pueden crear Nuevas
variables con algunas restricciones o condiciones.
Un ejemplo de transformación de la variable edad: la variable objetivo es el
nombre que se asigna a la nueva variable transformada: EDADMAYOR para
representar los valores de las edades de pacientes mayor o igual a 45 años. Se
genera una columna de datos en el visor de datos con los valores de las edades
solicitadas.
Analizar: con este comando se realizan las diferentes operaciones
estadísticas,
distribución de frecuencias, estadísticos descriptivos, comparaciones de
medias, regresiones, correlaciones, series de tiempo, análisis paramétrico y
no paramétrico, etc. Es decir, aplicaciones de Estadistica Descriptiva y
Estadistica Inferencial.
EJERCICIO DE DISTRIBUCION DE FRECUENCIAS CON SPSS
VARIABLE CUANTITATIVA.
Variable: Edad.
Ruta: Transformar/Agrupacion visual, y se selecciona la variable edad,
desplazandola con la flecha hacia el rectangulo del lado derecho.
Una vez ubicada la variable se activa la instrucción “Continuar”.
Posteriormente se nombra a la variable agrupada, para este caso se
escogió el nombre: EDADAG y se activa “crear puntos de corte”
En la primera celda se anota el valor mínimo de la serie de datos, ejemplo
el valor 22; se especifica el número de puntos de corte, que corresponde a
los intervalos de clase que se toman, 6 y automáticamente el SPSS asigna
la amplitud de cada intervalo.
Al activar la instrucción “Crear etiquetas” enseguida aparecen los intervalos
de clase.
Al procesar la distribucion de frecuencias aparece el siguiente aviso
indicando que fue procesada la instrucción dada. Se cierra este aviso y no
guardar
Lo anterior indica que la variable agrupada aparece en el visor de datos en
una nueva columna (ver EDADAG).
Por ultimo se realiza la distribucion de frecuencia asi:
Analizar/Estadisticos descriptivos/Frecuencias
Se carga la variable EDADAG y se da las instrucciones de calculo al SPSS.
En el comando “Estadistico” se despliegan todas las operaciones
descriptivas, media, mediana, moda, cuartiles, deciles, percentiles,
asimetria y curtòsis.
Al activar “Graficos” se despliegan los tipos de graficos: barras,
histogramas, graficos circulares, con la curva normal en el histograma y se
escoge “Continuar” y por ultimo “Aceptar”
RESULTADOS: a continuacion se muestran los resultados obtenidos con
aplicación del SPSS – 25.
Aparecen los estadisticos solicitados. En el primer nivel los estadisticos
descriptivos solicitados. En el segundo nivel aparece las frecuencias por
intervalo, tanto absoluta como relativa y acumuladas.
RESULTADOS:
Finalmente aparece el histograma de frecuencia con la curva normal
incorporada, lo que permite visualizar para efectos de análisis, cual rango
de datos de la variable es mas significativo y si la serie de datos tiene
distribucion aproximadamente normal.
Distribución de Frecuencias y Grafico Variable cualitativa: Variable
sexo.
La ruta para elaborar la distribución de frecuencias en SPSS es:
Analizar/Estadísticos descriptivos/Frecuencias (ver la siguiente imagen).
1. Cargar variable, Mostrar tabla de frecuencias y seleccionar gráfico.
Se selecciona la variable cualitativa correspondiente, en este ejemplo la variable
Sexo, y se ubica en el rectángulo marcado con “Variables” se define la instrucción
“Gráficos” y se despliega “Tipo de grafico”, se recomienda el grafico circular para
variable cualitativa, con pocos valores, en este caso tiene dos valores: “Hombre y
Mujer” se activa la instrucción “Mostrar tablas de frecuencias”.
2. Resultados del procesador. La imagen siguiente muestra información de
la muestra de datos, dice cuántos son “valido” y cuantos “perdidos”.
Distribución de frecuencias: Variable, sexo del paciente. Aparecen los
valores de la variable, “Hombre y mujer”, la frecuencia absoluta, 48 y 52
respectivamente, porcentaje de la frecuencia relativa, 48% y 52%,
finalmente el porcentaje acumulado o frecuencia relativa acumulada
porcentual.
Grafico. El procesador presenta el grafico siguiente. Se puede editar el grafico,
por ejemplo, que aparezca el nombre de la etiqueta o valor de la variable
“Hombre o mujer” y el porcentaje correspondiente.
Editar gráfico. Ubicando el cursor en el área del gráfico y con doble clic, se
superpone otro gráfico, y se activan instrucciones:” Archivo, Editar, Ver, Opciones,
Elementos.
En la instrucción “Elementos” se despliega “Mostrar elementos de datos”
En la casilla “Etiqueta Mostrado” se ubican los valores de la variable y
porcentaje, por ejemplo.
Presentación del gráfico.
Profundidad y ángulo. Se le da doble clic dentro del área del diagrama circular y
aparece profundidad y ángulo, se escoge 3D y se cambia profundidad ejemplo a
15 y aparece el siguiente gráfico.
Gráfico con profundidad.
Correlación de Variables (Tablas de contingencia o tablas cruzadas).
Corresponde al análisis estadístico multivariado. Intervienen dos o más variable,
una dependiente y la otra independiente(s), de acuerdo a la función matemática.
Se puede medir el grado de asociación o de correlación entre dichas variable, lo
mismo que el grado de independencia.
La correlación puede darse entre variables cuantitativas o entre variables
cualitativas en el primer caso la estadistica las ubica en el análisis paramétrico y el
segundo en el no paramétrico.
Existen diferentes coeficientes de correlación dependiendo que tipo de variables
se están asociando, ellos son: Coeficiente de correlación de Pearson, de
Spearman, Biserial puntual, Phi, de contingencia, de McNemar entre otros.
EJERCICIO.
A continuación, se dan imágenes de la ruta para una correlación de Contingencia,
porque se utilizan 2 variables cualitativas en forma de frecuencias: Sexo y tipo de
consulta médica. También se elabora una tabla de contingencia.
Se toma información de una base de datos correspondiente a un estudio de salud,
con pacientes de diferentes edades y tipos de consulta médica, medicina interna,
oftalmología, ortopedia y urología.
Ruta: Analizar/Estadísticos descriptivos/tablas cruzadas.
En Filas se carga la variable con más valores y en columnas la de menos valores.
En el comando “casillas” se dan características para los datos, si son observados,
esperados y porcentajes, luego se da clic en “continuar” y “aceptar”.
Resultados.
Tabla cruzada Tipo de consulta*Sexo del paciente
Sexo del paciente Total
Hombre Mujer
Tipo de consulta Medicina interna Recuento 15 12 27
% dentro de Tipo de
55,6% 44,4% 100,0%
consulta
Ortopedia Recuento 9 19 28
% dentro de Tipo de
32,1% 67,9% 100,0%
consulta
Urología Recuento 10 12 22
% dentro de Tipo de
45,5% 54,5% 100,0%
consulta
Oftalmología Recuento 14 9 23
% dentro de Tipo de
60,9% 39,1% 100,0%
consulta
Total Recuento 48 52 100
% dentro de Tipo de
48,0% 52,0% 100,0%
consulta
Estimación del coeficiente de contingencia. Ejemplo: Se pretende saber si existe
asociación entre el Sexo del paciente y el Tipo de consulta solicitado por el paciente.
Resultado: el coeficiente de correlación (r) es un valor comprendido entre (-1 y 1).
Si el coeficiente es un valor cercano a 1 o a -1 se dice que existe alta asociación
(positiva o negativa) entre las variables, si está cercano al valor cero (0) se dice
que las variables están incorrelacionadas.
El coeficiente del ejercicio es r=0,219, es decir, estadísticamente se observa que
hay poca asociación entre el sexo y el tipo de consulta, en la muestra de datos. La
significación aproximada (0,17) lo confirma teniendo en cuenta que es mayor que
0,05.
Medidas simétricas
Significación
Valor aproximada
Nominal por Nominal Coeficiente de contingencia ,219 ,170
N de casos válidos 100
Análisis descriptivos.
Estadísticos de tendencia central.
Media, mediana y moda.
Estadísticos de localización.
Cuartiles, quintiles, deciles y perce3ntiles.
Estadísticos de dispersión.
Varianza, desviación estándar, rango.
Estadísticos de forma.
Asimetría y curtósis.
Correlación.
Coeficiente de correlación de Pearson.
Coeficiente de correlación de Spearman.
Coeficiente de correlación Phi.
Coeficiente de correlación de contingencia.
Coeficiente de correlación biserial puntual.
Aplicación al SPSS-25.
Analizar/ estadísticos descriptivos/ frecuencias.
Se escogió por ejemplo la variable “Edad” y en “estadísticos” se seleccionan los
estadísticos a calcular: de tendencia central, de localización, dispersión y
asimetría.
Resultados descriptivos (univariado).
Estadísticos
Edad
N Válido 100
Perdidos 0
Media 52,99
Mediana 47,00
Moda 45
Desv. Desviación 16,989
Varianza 288,636
Asimetría ,151
Error estándar de asimetría ,241
Curtosis -1,268
Error estándar de Curtosis ,478
Percentiles 25 40,00
50 47,00
75 69,00
Correlaciones (bivariado).
Analizar/estadísticos descriptivos/tablas cruzadas.
Se da clic a “Tablas cruzadas” o de contingencia. Se ubican las variables en
filas y en columnas, se pide “Estadísticos” y aparecen diferentes coeficientes de
correlación. Se escoge solo un coeficiente de acuerdo al tipo de variable.
Criterios de escogencia del coeficiente de correlación.
Coeficiente de contingencia: dos variables nominales con dos o más
niveles de respuesta.
Coeficiente Phi: dos variables cualitativas dicotómicas.
Eta o coeficiente de correlación biserial puntual: una variable cualitativa
y otra cuantitativa.
En casillas. Se activan porcentajes por filas y columnas según el caso y se le da
“continuar. Resultados:
Tabla cruzada Tipo de consulta*Sexo
Sexo
Hombre Mujer Total
Tipo de consulta Medina interna Recuento 15 12 27
% del total 15,0% 12,0% 27,0%
Ortopedia Recuento 9 19 28
% del total 9,0% 19,0% 28,0%
Urología Recuento 10 12 22
% del total 10,0% 12,0% 22,0%
Oftalmología Recuento 14 9 23
% del total 14,0% 9,0% 23,0%
Total Recuento 48 52 100
% del total 48,0% 52,0% 100,0%
Se aprecia en la tabla de contingencia el total de hombres (48%) y mujeres (52%),
también se observa que el tipo de consulta más utilizado es “ortopedia” con el
28%.
Los coeficientes de correlación de Pearson y Spearman, se calculan así:
Analizar/Correlacionar/Bivariadas.
Se seleccionan las dos (2) variables a correlacionar y posteriormente se
selecciona el coeficiente correspondiente.
Por ejemplo: se selecciona el coeficiente de correlación de Pearson.
Resultados:
Correlaciones
Edad Días de ingreso
Edad Correlación de Pearson 1 ,468**
Sig. (bilateral) ,000
N 100 100
Días de ingreso Correlación de Pearson ,468** 1
Sig. (bilateral) ,000
N 100 100
**. La correlación es significativa en el nivel 0,01 (bilateral).
Se estima el coeficiente de correlación de Pearson con un valor de 0,468.
Indicando una buena correlación positiva entre las variables “Edad del paciente y
días de ingreso al Hospital”.
ANALISIS INFERENCIAL con aplicación de SPSS-25.
Generalidades
La inferencia estadística es una técnica o procedimiento estadístico que permite
tomar decisiones de una población basado en la evidencia que aporta una
muestra aleatoria de datos, con un nivel de confianza o nivel de significación
determinado por el investigador. Estos niveles generalmente utilizados pueden ser
del 90%, 95%, 98%, 99%, es decir, el nivel de significación considerado como alfa
(α) sería del 10%, 5%, 2% y 1% respectivamente. La utilidad de hacer inferencia
estadística radica en que el análisis exhaustivo de los datos de una población,
suele suceder dispendioso, costoso en términos monetarios y no arrojaría
resultados agiles e inmediatos en el tiempo; por esa razón en las auditorias se
utiliza una muestra representativa de la población, la cual daría las evidencias en
la toma de decisiones.
Intervalo de confianza.
Este primer paso de la inferencia estadística para variable cuantitativa
(numérica), consiste en estimar un intervalo basado en la información de la
muestra, en el que probablemente (nivel de confianza) este contenido el
parámetro promedio poblacional (µ) o la varianza poblacional (σ2). Este tipo
de análisis se conoce como análisis paramétrico.
El intervalo de confianza se define como:
P(X - ≤ µ≤ X + ) = 1-α . Este intervalo de confianza supone
que la muestra de datos es grande (n), es superior a 30 observaciones y la
varianza es conocida, por eso se utiliza la distribución normal de
probabilidad (Z).
P(X - ≤ µ ≤ X + ) = 1-α . En esta fórmula general, el
intervalo
de confianza supone que la muestra es pequeña (n<30) y la varianza es
desconocida. Se utiliza la distribución t de student.
Aplicación con el software IBM Statics SPSS-25.
Teniendo en cuenta que al procesador SPSS-25, se carga una base datos,
este utiliza la prueba t para una muestra.
Ejercicio: Estimar un intervalo de confianza del 95% para la edad promedio
de todos los pacientes del hospital referenciado en la base de
datos, para lo cual se toma una muestra aleatoria de 100 datos.
Ruta: Analizar / Comparar medias / Prueba T para una muestra.
Después de dar “enter” aparece la prueba T para una muestra, se escoge la
variable “Edad” y en el “valor de prueba” se coloca el valor cero (0). En
“opciones” se escoge el nivel de confianza correspondiente, el SPSS trae
parametrizado el 95%, pero este puede ser cambiado al porcentaje que se
necesite.
Para que el procesador SPSS realice los cálculos, se da click en “continuar” y
luego “aceptar”.
Resultados:
La primera tabla “Estadísticas para una muestra” aparecen los datos validos
procesados, la media muestral y la desviación estándar.
Estadísticas para una muestra
Desv. Desv. Error
N Media Desviación promedio
Edad 100 52,99 16,989 1,699
En la siguiente tabla “Prueba para una muestra”, está el intervalo de confianza
del 95%, con los límites de confianza (49,62 y 56,36). Indica que con una
confianza o confiabilidad del 95%, la edad promedio de todos los pacientes
atendidos en ese hospital oscila entre 59,62 años y 56,36 años de edad. Basados
en la evidencia aportada por la muestra de 100 pacientes.
Prueba para una muestra
Valor de prueba = 0
95% de intervalo de confianza de
Diferencia de la diferencia
t gl Sig. (bilateral) medias Inferior Superior
Edad 31,190 99 ,000 52,990 49,62 56,36
Prueba de hipótesis estadística o contraste de hipótesis o dócima de
hipótesis.
Es otra forma de hacer inferencia estadística, consiste en establecer una
hipótesis nula o nulidad (H0), acerca del valor puntual del parámetro
promedio poblacional que no se conoce (µ) y una hipótesis alterna o
alternativa (Ha) que contradice a la hipótesis nula. Esto es aplicable
también cuando el contraste de hipótesis se realiza con la varianza
poblacional (σ2).
Pasos a seguir en la prueba de hipótesis:
1. Escoger la variable o las variables del análisis.
2. Establecer las hipótesis estadísticas.
3. Escoger el estadístico de la prueba: si el análisis es paramétrico porque
se utilizan variables cuantitativas o numéricas, se utilizan los
estadísticos: distribución Z o t de student. Si el análisis es no
paramétrico porque se han escogido variables cualitativas, se utiliza
entre otros el estadístico Chi-cuadrado (x2).
4. Tomar decisión, si se acepta H0 o si se rechaza H0, según criterios de
valores críticos del estadístico (en la tabla) y valores calculados.
También con valor-p (sig.) y valor alfa (α).
5. Conclusiones. Se escribe si se cumplen los objetivos de la investigación
de acuerdo con las evidencias aportadas por la muestra de datos (n).
Aplicación con el software IBM Statics SPSS-25.
Ejercicio: Con base en la información del ejercicio anterior del intervalo de
Confianza. Suponga que el Director del hospital afirma que la
Edad promedio (µ) de todos los pacientes que ha atendido el
Hospital es de 49 años. Realice una prueba de hipótesis con
Un nivel de significancia del 5% (una confianza del 95%), para
Probar que la edad promedio es diferente.
1. Variable: la edad de los pacientes.
2. Hipótesis estadísticas:
H0 : µ = 49
Ha: µ ≠ 49
3. Estadístico de la prueba: t para una muestra, porque se
conocen los datos de la muestra y la varianza es
desconocida.
Ruta: Analizar / Comparar medias / Prueba T para una muestra. Dar “Enter”
Prueba T para una muestra.
Seleccionar la variable de prueba: Edad.
Valor de prueba: 49, que es el valor de µ en la hipótesis.
Opciones: seleccionar el porcentaje de confianza, es este caso 95%.
Click en continuar y luego click en aceptar.
Resultados:
Prueba para una muestra
Valor de prueba = 49
95% de intervalo de confianza de
Diferencia de la diferencia
t gl Sig. (bilateral) medias Inferior Superior
Edad 2,349 99 ,021 3,990 ,62 7,36
4. Decisión.
Para rechazar la hipótesis nula, se puede utilizar el siguiente
criterio: Si, valor-p (sig. Bilateral) < α, es decir, 0,021<0,05,
porcentualmente, 2,1% < 5%. Se rechaza H0.
Se escogió un nivel de confianza del 95%, entonces el nivel
de significancia α = 5% = 0,05.
5. Conclusión.
Al rechazar la hipótesis nula H0, se concluye que la muestra
de las edades de 100 pacientes del hospital, aporto
evidencias que permite asegurar que la edad promedio es
diferente de 49 años, con una confiabilidad del 95%.
Prueba de Hipótesis no paramétrica.
Ejercicio: Realizar una prueba de independencia entre las variables género y
tipo de consulta médica con una significancia del 5%.
1. Variables cualitativas: Genero del paciente y Tipo de consulta médica
solicitada por el paciente.
2. Hipótesis estadísticas:
H0: El tipo de consulta médica solicitada por el paciente es independiente del
del genero del paciente.
Ha: El tipo de consulta médica solicitada por el paciente no es independiente
del género del paciente.
3. Estadístico de la prueba. Por ser variables cualitativas, se utiliza Chi-
cuadrado.
Procesamiento en SPSS.
Ruta: Analizar / Estadísticos descriptivos / Tablas cruzadas. Dar click.
Tablas cruzadas.
Se escogen las variables a contrastar en filas y columnas. Procurando que la variable
con más niveles de respuestas vaya en las filas. Ejemplo la variable sexo es dicotómica
con dos valores: Hombre y mujer. La variable Tipo de consulta tiene 4 niveles de
respuestas: Medicina interna, Urología, Ortopedia y Oftalmología.
En la ventana “Estadísticos” se selecciona Chi-cuadrado (X2) y luego se da click en
“continuar” y por ultimo click en “Aceptar”.
Resultados.
El procesador SPSS-25 muestra el valor del estadístico calculado X2 = 5,022 que
se compara con el Chi-cuadrado crítico de la tabla con α = 0,05 (5%) y tres (3)
grados de libertad, que se obtienen (F-1) *(C-1), en donde filas son 4 y columnas
2. El valor crítico de la tabla para Chi-cuadrado es 7,816.
Pruebas de chi-cuadrado
Significación
asintótica
Valor df (bilateral)
a
Chi-cuadrado de Pearson 5,022 3 ,170
Razón de verosimilitud 5,103 3 ,164
Asociación lineal por lineal ,352 1 ,553
N de casos válidos 100
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento
mínimo esperado es 10,56.
4. Decisión.
Criterio 1.
Si, Chi-cuadrado calculado es mayor que el Chi-cuadrado critico (el de
la tabla), entonces se rechaza la hipótesis nula H0, de lo contrario no se
rechaza la hipótesis nula.
Criterio 2.
Si el valor-p (sig.) es menor que α, se rechaza la hipótesis nula H0, de lo
contrario no se rechaza la hipótesis nula.
α=0,05 (5%)
Sig. = 0,170 (17%).
17% > 5% no se rechaza la hipótesis nula H0.
5. Conclusión.
Se encontraron evidencias en la muestra de 100 pacientes que permite
concluir que es independiente el tipo de consulta que solicita el paciente
con el sexo del paciente.