Está en la página 1de 9

Tema :

APLICACIONES AL ANÁLISIS DE DATOS USANDO ESTADÍSTICAS CON


SPSS PARA INVESTIGACIONES MEDICAS
Curso: Informática Aplicada a la Investigación - Prof. Ulises ROMAN C- Enero. 2007

RESUMEN
En las investigaciones medicas en la actualidad, se usan mucho las estadísticas, para
generar cálculos, gráficos y reportes. Es así como la investigación estadística en todos
los campos de la ciencia (ciencias de la salud, economía, ciencias sociales, , ciencias de
la educación, etc) se ha visto facilitada con el uso de las herramientas
computacionales para su presentación y procesamiento, con ello generar resultados
sobre la exploración de los datos.

EL SPSS:
Statistical Package for the Social Sciences (SPSS), fue desarrollado por Hull y Nie
hace 30 años, en la actualidad con mas difusión mundial. Es un software modular
(base, mapas, tablas, modelos de regresión, modelos avanzados, pruebas exactas,
tendencias, categorías, análisis de conjuntos, valores perdidos, etc.). Chaid y spss
base ofrecen técnicas : para el acceso, manipulación, análisis y presentación de
datos: Análisis Exploratorio, tablas de contingencia, correlación y regresión lineal
múltiple, análisis factorial, discriminante y de conglomerados(clusters), calculo de
proximidad, etc.

VERSIONES SPSS:

SPSS 9 (versión Ingles)


SPSS 10 (Versión Ingles)
SPSS 12 (versión Español-Ingles)
SPSS 14 (última versión)

CARACTERISTICAS DEL SPSS:


- Graficas Mejoradas (3-D)
- Gestion de datos (Nombre de variables mas largos)
- Muestras complejas
- Sistema de Gestion de resultados

INSTALACION DEL SPSS:


1. Insertar CD Æ Opción instalar SPSS
2. Setup
3. Continuar con el proceso que indica el SW
ENTORNO DE TRABAJO DE SPSS:

VISTA DE DATOS (Figura Mostrada)


VISTA DE VARIABLES (Figura mostrada)
PRACTICA No.03 DE LABORATORIO

APLICACIONES AL ANÁLISIS DE DATOS USANDO ESTADÍSTICAS CON


SPSS PARA INVESTIGACIONES MEDICAS
Curso: Informática Aplicada a la Investigación - Prof. Ulises ROMAN C- Enero. 2007

Para el acceso, manipulación, análisis y presentación de datos como: Análisis


Exploratorio, tablas de contingencia, correlación y regresión lineal múltiple, análisis
factorial, discriminante y de conglomerados (clusters), calculo de proximidad, etc es
necesario contar con el software SPSS para este caso la versión 12. a continuación se
presenta esquemas generales – para lo cual se debe contar con la DATA
correspondiente del caso de la Investigación Medica:

1. Definir los Datos (definir propiedades, insertar variables, etc)


2. Analizar (Tablas, modelos, Informes, etc)
3. Transformar (calcular, decodificar, etc)
4. Mostrar las Graficas (Tipos de gráficos, etc)

Ejercicio 1:
Los Directivos del Hospital Docente de la UNMSM pide que se haga un análisis
sanguíneo para 80 pacientes, dado que los valores de pH sanguíneo son las siguientes:
7.33 7.32 7.34 7.40 7.28 7.29 7.35 7.33 7.34 7.28
7.31 7.35 7.32 7.33 7.33 7.36 7.32 7.31 7.35 7.36
7.26 7.39 7.29 7.32 7.34 7.30 7.34 7.32 7.39 7.30
7.33 7.33 7.35 7.34 7.33 7.36 7.33 7.35 7.31 7.33
7.37 7.38 7.38 7.33 7.35 7.30 7.31 7.33 7.35 7.33
7.27 7.33 7.32 7.31 7.34 7.32 7.34 7.32 7.31 7.36
7.30 7.37 7.33 7.32 7.31 7.33 7.32 7.30 7.29 7.38
7.33 7.35 7.32 7.33 7.32 7.34 7.32 7.34 7.32 7.33
a) Definir la variable pH, Tipo (Numerico), Anchura(8), Decimal (2), mPerdidos
(ninguno), columna(2), Alineación(derecha), Medida(Escala)

b) En Vista de Ingresar los datos de los 80 individuos como se muestra en la tabla


anterior.

c) Realizar un análisis exploratorio completo de los datos del pH incluyendo


gráficos de caja y bigotes, diagramas de tallo y hojas y análisis de simetría de
normalidad.

d) Construir el histograma de frecuencias absolutas y relativas

e) Construir el histograma de frecuencias relativas acumuladas


Ejercicio 2:
Se tiene el archivo TIERRA que contiene indicadores demográficos, económicos,
sanitarios y otros tipos para diversos países del mundo entre los que se
encuentran la ESPERANZA DE VIDA FEMENINA (variable espvidaf), la
ESPERANZA DE VIDA MASCULINA(espvidam) y el PROCENTAJE DE
ALFABETIZACION (alfabet). En total contiene 26 VARIABLES como se muestra en
la figura . Se desea hacer procedimientos correlacionales bivarias para calcular: el
coeficiente de correlación de pearson, el coeficiente de Rho de Spearman y la
Tau-b de Kendall con sus niveles de significación. Los datos anlizados son 109
países.
a) calcular: el coeficiente de correlación de pearson con sus niveles de
significación
b) Calcular de Pearson , el coeficiente de Rho de Spearman y la Tau-b de Kendall
con sus niveles de significación

c) Para el análisis de correlación bivaraida seleccionar dos o mas variables – puede


tomar las variables: alfabet , espvidam y espvidaf.

d) Interpretación de los resultados dados

Los Coeficientes de correlación pueden estar entre -1 (una relación negativa


perfecta) y +1 (una relación positiva perfecta). Un valor 0 indica que no existe una
relación lineal.
Ejercicio 3:
Se tiene el archivo TIERRA que contiene indicadores demográficos, económicos,
sanitarios y otros tipos para diversos países del mundo. Determinar los informes y
resumen de casos teniendo en consideración lo siguiente:
a) Seleccionar una o mas variables del archivo TIERRA para Clasificar la Población
Mundial (poblac), el indice de alfabetizacion(alfabet) y la mortalidad
infantil(mortinf) por religiones(relig)
b) Determinar Numero de casos, Media, Desviación típica, curtosis, Varianza,
Mínimo, Máximo, Porcentaje de N total
c) Interpretación de los resultados dados.

Ejercicio 4:
Se tiene la siguiente tabla bidimensional de frecuencias con los datos sobre presiones
diastolitas de la sangre tomadas en reposo. Los valores de las variables T denotan el
tiempo en minutos transcurridos desde el comienzo del descanso y los valores de la
variable P presentan las presiones diastolitas.

T 0 5 10 15 20
P
66 1 1 0 1 2
68 3 2 1 0 1
70 0 1 9 1 2
72 1 2 1 2 1
74 3 1 2 1 2

a) Introducir adecuadamente los valores de las dos variables P y T en la Columna


del Editor SPSS – Ejemplo para P=66 y T=0 se introduce 1 vez, P=68 y T=0 se
introduce 3 veces, y así sucesivamente se introduce cada para de valores.
b) Estudiar el grado de dependencia lineal existente entre las dos variables.
c) Hallar las distribuciones marginales de P y T y sus medias y desviaciones
típicas
d) Hallar la Distribución de P condicionada a que T y su esperanza, varianza y
mediana
e) Interpretar los resultados dados.

Ejercicio 5:
Análisis de Cluster (conglomerados) el SPSS incorpora un procedimiento que
implementa el análisis de cluster no jerárquicos mediante el método de k-medias. Este
procedimiento intenta identificar grupos de casos relativamente homogéneos
basándose en las características seleccionadas y utilizando un algoritmo que puede
gestionar un gran numero de casos. El usuario debe especificar el numero de
conglomerados (centros iniciales de los conglomerados si conoce de antemano).
Trabajar con el Archivo TIERRA Para la solución completa se obtendrá los centros
iniciales de los conglomerados y la tabla ANOVA. Para cada caso se obtendrá
información del conglomerado y la distancia desde el centro del conglomerado. Ejm.
Podemos preguntar ¿ Cuales son los grupos identificables de países con población,
densidad de población y población urbana similares?. Son el Análisis de
Conglomerados k-medias, podrían agruparse los países en k grupos homogéneos
basados en las características consideradas.

a) Abrir el archivo TIERRA y guardar con TIERRACLUSTER

b) Realizar el análisis de cluster no jerárquico de k-medias. Las variables


clasificadoras a considerar son: Población (poblac), población urbana(urbana) y
densidad (densidad), como variable de agrupación usamos país(pais). En cuanto
a los datos las variables deben ser cuantitativas en el nivel de intervalo o
razón. Si las variables son binarias o recuentos, utilice el procedimiento análisis
de conglomerados jerárquicos.

c) Solo clasificar el numero de conglomeraciones

d) Hacer 30 iteraciones con medida

e) Interpretación de los resultados dados

|
Nota: se definirá la práctica completa la próxima semana
Libro de Referencia: TECNICAS ESTADÍSTICAS CON SPSS 12 – CESAR PEREZ
PRACTICA No.04 DE LABORATORIO
APLICACIONES AL ANÁLISIS DE DATOS USANDO ESTADÍSTICAS CON
SPSS PARA INVESTIGACIONES MEDICAS
Curso: Informática Aplicada a la Investigación - Prof. Ulises ROMAN C- Enero. 2007

Ejercicio 1:
Hacer un análisis estadístico usando SPSS para predecir el comportamiento de los
usuarios externos de los hospitales y/o Clínicas donde determinar: Cuales son los
patrones de comportamiento en el presente y como será en el futuro respecto a la
atención, diagnostico, enfermedades y pronostico. Se debe determinar cual es el
perfil del usuario del servicio (edad, sexo, procedencia, grado de instrucción, a que
servicios acude más y otros). Para complementar en el análisis de datos usar el
concepto de minería de datos y generar gráficos y reportes correspondientes
usando el paquete SPSS. Nota los datos deben ser reales para ver comportamiento
real y la predicción real (mínimo 200 usuarios, mejor si es mayor).

Para el Análisis de Datos pueden tomar 2 o más categorías debajo descritos- estos
son algunas aplicaciones que se puedan realizar en los Hospitales, Clínicas y
Consultorio de Salud.

1. Descubrir distintos comportamientos de una misma patología.


2. Realizar pronósticos ajustados a cada paciente.
3. Predecir las patologías que pueden aparecer como complicación de una
enfermedad determinada.
4. Encontrar la predisposición a padecer determinadas enfermedades.
5. Descubrir asociaciones entre patologías.
6. Determinar el mejor tratamiento individual para cada paciente.
7. Sistema de apoyo al diagnóstico.
8. Descubrir nuevas características de una patología.
9. Comparación entre parámetros clínicos.

Así, por ejemplo, en el caso de descubrir comportamientos de una misma patología, los
sistemas de minería de datos pueden encontrar subgrupos, dentro de una determinada
patología, que tienen características comunes dentro del mismo subgrupo y diferentes
entre los diversos subgrupos. Estas clasificaciones pueden encontrarlas el sistema de
manera automática, es decir, a partir de las relaciones que el sistema encuentra por sí
mismo y que no tienen porqué atenerse a las clasificaciones clásicas realizadas con
interés académico, clínico o fisiopatológico.
Fecha de Presentación: Miércoles, Grupo (16 alumnos como máximo)

También podría gustarte