Está en la página 1de 11

ESTADÍSTICA APLICADA

UNIDAD V: INFORME Y EJERCICIOS

Profesor: Realizado por:


Ing. Annys Silva Joel Morao C.I: 30.510.135
Trayecto 2. Fase 2
Sección: MM01

22/01/2021
Introducción
SPSS es un programa estadístico informático muy usado en las ciencias sociales y
aplicadas, además de las empresas de investigación de mercado. Originalmente, el nombre
de este programa era acrónimo que significaba Statistical Package for the Social Sciences
(SPSS), reflejando la orientación a su mercado original (ciencias sociales), aunque este
programa es también muy utilizado en otros campos como la mercadotecnia. Sin embargo,
en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no es
acrónimo de nada.

Siguiendo con lo anterior, el SPSS es uno de los programas estadísticos más conocidos
teniendo en cuenta su capacidad para trabajar con grandes bases de datos y una sencilla
interfaz para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar análisis
con dos millones de registros y 250 000 variables. El programa consiste en un módulo de
base y módulos anexos que se han ido actualizando constantemente con nuevos
procedimientos estadísticos. Cada uno de estos módulos se compra por separado. Por
ejemplo, SPSS puede ser utilizado para evaluar cuestiones educativas.

Actualmente, compite no sólo con programas licenciados como SAS, MATLAB,


Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más
destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado
PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas
operativos como Linux, además de versiones para Windows y macOS. Este último paquete
pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.

En concordancia con lo antes mencionado, el SPSS fue creado en 1968 por Norman H.
Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago
por medio de su National Opinion Research Center estuvo a cargo del desarrollo,
distribución y venta del programa. A partir de 1975 corresponde a SPSS Inc.

Originalmente, el programa fue creado para grandes computadores. En 1970 se publica


el primer manual de usuario del SPSS por Nie y Hall. Este manual populariza el programa
entre las instituciones de educación superior en Estados Unidos. En 1984 sale la primera
versión para computadores personales.
Variable

Una variable es cualquier fenómeno o cualidad que pueda sumir valores numéricos.
Estas se clasifican, en función de la naturaleza matemática que cumplen para la
investigación, en cualitativas y cuantitativas. Una variable de tipo cualitativo es aquella que
representa una cualidad (no son medibles numéricamente), mientras que la variable
cuantitativa expresa una cantidad (implican el concepto de magnitud).

Desde el punto de vista metodológico, estas pueden ser dependientes (el objeto de
estudio) e independientes (de clasificación o aquellas que introducimos para provocar
cambios en la variable dependiente). Se definen a partir de un sistema de categorías que las
representen. Han de cumplir tres condiciones para su correcta formulación (claramente
definidas, exhaustivas –han de tenerse en cuenta todos y cada uno de los casos, de modo
que todos los sujetos puedan estar identificados– y excluyentes mutuamente –cada caso
sólo puede estar incluido en una categoría).

En este sentido, podemos disponer de variables uncategoriales, dicotómicas y


politómicas. Cuando se abre SPSS aparece la matriz de datos vacía indicando en ese caso
que no hay ningún fichero seleccionado para trabajar con él; es en esta situación en la que
debemos estar para proceder a crear la estructura (definir las variables) de un nuevo fichero
de datos de SPSS. A esa situación también se puede llegar después de haber trabajado con
SPSS sin más que desplegar el menú Archivo y elegir de él la opción Nuevo y dentro de
ella datos (Archivo, Nuevo, Datos), lo que hará que se elimine el fichero activo y se deje
limpia la matriz de datos.

Ahora cada columna será una nueva variable en potencia hasta que sea definida, en cuyo
caso pasará a ser una variable en la nueva matriz de datos. Una variable queda
automáticamente definida si en alguna casilla de su columna se introduce algún dato: SPSS
define una variable adecuada al primer dato introducido. A estas variables, SPSS les asigna
por defecto un nombre constituido por las letras VAR seguidas de un código de cinco
dígitos (00001, para la primera; 00002 para la segunda; …). Siempre podremos cambiar
después el nombre y las características de la(s) variable(s) así definida(s).
De todas formas, la manera más natural de crear las variables de un fichero es definirlas
antes de introducir dato alguno. Para ello hemos de situarnos en la vista de variables de la
ventana principal de SPSS, pinchando en la pestaña correspondiente o haciendo doble clic
en la cabecera de la columna. En la vista de variables, cada fila corresponde a una variable,
y las columnas representan las características de la(s) variable(s). Para cada variable habrá
que ir especificando cada una de sus características, empezando por el nombre (primera
columna).

El tipo de las Variables

Una vez escrito el nombre de la variable, si se pincha en la casilla correspondiente al tipo


de variable (o en cualquier otro sitio), aparecerá, para dicha variable, “numérico” en la
columna Tipo, un 8 6 en la columna Anchura y un 2 en la columna Decimales. Esto es lo
que SPSS ofrece por defecto para esa variable. Para cambiar el tipo de la variable se pincha
en la casilla de tipo de variable y se pincha sobre el pequeño recuadro gris situado en dicha
casilla, aparece entonces una ventana como la de la Figura 4; en ella se puede definir el tipo
de la variable de entre los que aparecen: numérico, cadena, fecha, etc. El formato de la
ventana es muy simple, a la izquierda aparecen los diferentes tipos que pueden tener las
variables y a la derecha aparece el tamaño o características particulares de cada tipo que
también son definibles; así en la figura 4, el tipo es numérico y la variable tendrá una
anchura total de 8 caracteres, dos de los cuales son decimales: esto es lo que por defecto
coloca SPSS. Pero describamos los diferentes tipos.

El tipo Numérico es para una variable cuyos valores son números. Los valores se
muestran en el formato numérico estándar, utilizando como delimitador decimal el
especificado en la Configuración Regional del Panel de control de Windows. El tipo Coma
define una variable numérica cuyos valores se muestran con la coma de separación de miles
y con un punto como separador de la parte decimal. El tipo Punto define una variable
numérica cuyos valores se muestran con el punto de separador de miles y con una coma
como separador de la parte decimal. El tipo Notación científica define una variable
numérica cuyos valores se muestran con una E intercalada y un exponente con signo que
representa una potencia de base diez.

El exponente puede ir precedido de E o D con un signo opcional, o por el signo


solamente. Por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2, o incluso 1,23+2. El tipo Fecha
define una variable numérica cuyos valores se muestran en uno de los diferentes formatos
de fecha-calendario u hora-reloj. Para ello, habrá que seleccionar un tipo de fecha de la lista
desplegable que aparece a la derecha cuando se selecciona el tipo fecha. Se pueden
introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o
espacios en blanco. El tipo Dólar sirve para definir una variable numérica (con diferentes
formatos) cuyos valores contienen un signo de dólar y una coma para la separación de los
miles. Moneda personalizada sirve para definir una variable numérica cuyos valores se
muestran en uno de los formatos de moneda personalizados que se hayan definido
previamente en la pestaña Moneda del cuadro de diálogo Opciones dentro del menú
Edición.

Los caracteres definidos en la moneda personalizada no pueden emplearse para la


introducción de datos, pero sí los mostrará el Editor de Datos. Por último el tipo Cadena
define una variable cuyos valores no son numéricos y, por ello, no se utilizan en los
cálculos. Pueden contener cualesquiera caracteres hasta la longitud definida. Estas variables
son conocidas como variables alfanuméricas. El tamaño y el formato de cada tipo se
expresa en los campos que aparecen en la parte de la derecha de la ventana. Habrá que
especificar el tamaño total y el número de decimales en los tipos Numérico, Coma, Punto y
Notación Científica, colocándose sobre los huecos oportunos y escribiendo ahí un número
para el tamaño global y otro para el número de decimales. La anchura máxima en todos
ellos es de 40 posiciones, siendo 16 el número máximo de cifras decimales. Para el tipo
Cadena habrá 7 que especificar la anchura total que no podrá sobrepasar los 255 caracteres.
Para los tipos de Fecha, Dólar y de Moneda Personalizada habrá que elegir el formato de
entre los que aparecen a la derecha en la ventana de definición de tipos.

Por último, la anchura y número de decimales se pueden cambiar igualmente en las


columnas Anchura y Decimales de la vista de variables.

Vistas del Editor de Datos de SPSS

El editor de datos cuenta con dos diferentes tipos de vistas (Datos y Variables), a través
de las cuales podemos modificar o definir parámetros específicos de la información
contenida en el archivo. La primera de estas vistas corresponde a la Vista de datos [Fig.1-
33]. Esta es la vista que aparece por defecto en el editor de datos y mediante ella podemos
ingresar, modificar o eliminar los casos y registros (valores) del archivo. La estructura de la
vista de datos esta diseñada de manera, que las variables (Preguntas) se ubiquen en las
columnas y los casos, registros u observaciones se ubiquen en las filas.

Figuras 1-33

A través de la Vista de datos podemos observar, modificar o eliminar cada uno de los


valores de los casos que componen el archivo de datos. Además cuando creamos un archivo
nuevo, es en esta vista donde se ingresan los datos; para realizarlo debemos ingresar la
información en cada una de las casillas. Es necesario resaltar que se denomina Caso a las
repuestas que un individuo proporciona a la totalidad de las preguntas o variables del
archivo.

La segunda vista del editor de datos corresponde a la Vista de Variables [Fig.1-34]. A


través de la vista de variables se definen los parámetros informativos de las preguntas o
variables del archivo; esta vista es sin ninguna duda la parte más importante del paquete, ya
que de la correcta definición de nuestras variables depende la efectividad de nuestro
análisis y los procedimientos que podamos realizar con ellas. Para seleccionar esta vista
basta con hacer clic sobre la pestaña Vista de variables ubicada en la parte inferior de la
ventana.

Figuras 1-34

Al seleccionar la vista de variables, aparece en la parte superior del área de datos una
serie de propiedades preestablecidas por el programa entre las que encontramos Nombre,
Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columna, Alineación y Medida.
Cada una de estas propiedades tiene un propósito específico y es necesario antes de generar
algún tipo de análisis, comprobar que estén correctamente diligenciados cada uno de los
campos. Si nos fijamos en las casillas de la vista notaremos que ahora las filas
corresponden a cada una de las variables de nuestra base o archivo; esto se debe a que en la
vista de variables la estructura esta diseñada para que las Propiedades de las variables se
ubiquen en las columnas y las variables se ubiquen en las filas.

Es importante hacer notar la diferencia estructural entre la Vista de Variables y la Vista


de Datos [Fig.1-35]; esta diferencia se produce debido a que en la Vista de
variables definimos las características de las variables; es decir, sus propiedades. Lo único
que se realiza en esta vista, es ingresar información complementaria de las variables, la cual
determina los procedimientos que pueden ser empleados en el análisis, de acuerdo a las
características de la variable. Mientras la Vista de datos nos permite ingresar, modificar o
eliminar los datos (registros o variables) del archivo.

Figuras 1-35

Si nos fijamos en las estructuras de las vistas del Editor de datos, notaremos que para la
vista de datos, las variables se ubican en las columnas y los casos o registros se ubican en
las filas, mientras que para la vista de variables, las propiedades (Definición) se ubican en
las columnas y las variables se ubican en las filas. Una vez aclaradas las diferencias
estructurales de las vistas, continuaremos describiendo cada una de las propiedades de las
variables, las cuales determinan en gran medida los diferentes procedimientos que se
pueden realizar con los datos.

EJERCICIOS

Ejercicio 1

Comparamos 4 tratamientos clínicos (A, B, C, D) asignando al azar 15 sujetos a los


mismos. Las puntuaciones de los sujetos en la VD (un cuestionario de escala de 0 a 150
puntos) fueron:

A: 42, 0, 63

B: 45, 64, 33, 29

C: 44, 82, 64, 74

D: 109, 120, 116, 97

a) Compara si las varianzas de los 4 grupos son similares

b) Analiza si hay diferencias entre los grupos

c) ¿Cuál es el grupo que rinde mejor? ¿Y el peor?


d) Analiza la pregunta b) mediante la prueba no paramétrica adecuada

Se trata de comparar 4 muestras independientes mediante un ANOVA inter (en SPSS:


Analizar > Modelo General Lineal > Univariante)

a) Pedimos al SPSS en opciones que nos haga un test de homogeneidad (Levene). Dicho
test nos da sig=0.207, luego hay homogeneidad, homoscedasticidad o igualdad en las
varianzas de los 4 grupos.

b) El ANOVA inter (por Modelo General Univariante) nos da F3,11=12.15, p=0.001, eta2=
0.768, luego hay diferencias globales entre los 4 grupos, es decir la VI influye
significativamente sobre la VD. Ahora en c) veremos entre qué grupos hay diferencias y
entre cuáles no las hay.

c) En opciones seleccionaremos la prueba de Bonferroni (en mostrar medias...). Los


resultados nos muestran que la media del grupo D (=110.5) difiere significativemente del
las otras 3 medias (A=35, B=42.75, C=66), entre las cuales no hay diferencias
significativas. Ello quiere decir que el mejor tratamiento es el D, mientras que el peor
serían los tratamientos A, B, y C indistintamente.

d) (SPSS: Analizar > Pruebas no paramétricas > Cuadros de diálogo antiguos > k muestras
independientes). Aplicaremos una prueba de Kruskall-Wallis que nos dará una chi2 3=10.5,
p=0.015, lo que coincide con los resultados de b). Si quisiéramos hacer pruebas a posteriori
no paramétricas aplicaríamos 6 pruebas de Mann-Whitney (por otras tantas comparaciones
por pares de medias) aplicando la correción de Bonferroni (.05/6).

Ejercicio 2

Una muestra al azar de 6 sujetos lee 1, 3 y 5 veces una lista de 50 palabras que deben
memorizar. Tras cada lectura se les pasa una tarea de recuerdo. Sus resultados (o aciertos)
fueron:

1 lectura: 15, 17, 14, 18, 18, 16

3 lecturas: 21, 25, 22, 24, 29, 27

5 lecturas: 28, 32, 34, 35, 30, 30


a) Analiza si se cumplen los supuestos del ANOVA

b) ¿Incrementa el número de lecturas el recuerdo?

c) ¿Dónde se dan los mejores y peores resultados?

d) Analiza la pregunta b) mediante la prueba no paramétrica adecuada

ANOVA intra (en SPSS: Analizar > Modelo General Lineal > Medidas Repetidas)

a) Test de esfericidad de Mauchly: sig=.187. Se cumplen los supuestos.

b) Sí porque F2,10=64.503 , p=0.0001, eta2=0.928

c) Las pruebas a posteriori de Bonferroni muestran que las tres diferencias son
estadísticamente significativas luego la mayor tasa de aciertos se da tras cinco lecturas
mientras que la peor se da tras la primera lectura.

d) (SPSS: Analizar > Pruebas no paramétricas > Cuadros de diálogo antiguos > k muestras
relacionadas). Friedman: chi2 2=12, p=0.002. Si quisiéramos hacer pruebas a posteriori no
paramétricas aplicaríamos 3 pruebas de Wilcoxon (por otras tantas comparaciones por
pares de medias) aplicando la correción de Bonferroni (.05/3).
Conclusión

El programa SPSS ofrece estadísticas avanzadas además de muchas funciones


estadísticas básicas, incluyendo la tabulación cruzada, frecuencias, estadísticas de variables
dobles como las pruebas T y ANOVA, lineal y modelos no lineales.

Su facilidad de uso, flexibilidad y escalabilidad hacen que SPSS sea accesible para
usuarios con cualquier nivel de conocimiento. Además, es adecuado para proyectos de
todos los tamaños y niveles de complejidad, y puede ayudar a un individuo y a su
organización a encontrar nuevas oportunidades, mejorar la eficiencia y minimizar el riesgo.

De acuerdo con lo anterior, debido a s facilidad, versatilidad y variedad de funciones lo


hace indispensable en el mundo de la estadística, contribuyendo al desarrollo de empresas,
organizaciones, países y al mundo entero.

También podría gustarte