Está en la página 1de 41

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

MANUAL DE SPSS APLICADA A LA ESTADISTICA


Doc. Juan Roberto Morales Romero

Doc. Juan Roberto Morales Romero

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


SPSS Y EXCEL APLICADA A LA ESTADISTICA 1.1 Ventanas del SPSS
Existen diversos tipos de ventanas en SPSS: 1. Editor de datos: Muestra el contenido del archivo de datos y se abre automticamente cuando se inicia una sesin de SPSS. No se puede tener ms de un archivo de datos abierto al mismo tiempo.

Figure 0-1 2. Visor: Muestra todas las tablas, los grficos y los resultados estadsticos. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del visor se abre automticamente la primera vez que se ejecuta un procedimiento que genera resultados.

Doc. Juan Roberto Morales Romero

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-2 3. Visor de borrador: Los resultados pueden mostrarse como texto normal (en lugar de como tablas pivote interactivas) en el Visor de borrador. 4. Editor de grficos: Permite modificar y guardar los grficos y diagramas con extensin .sct. Para ello se selecciona el grfico en el visor y se hace doble-click con el ratn.

Figure 0-3 5. Editor de tablas pivote: Permite modificar los resultados mostrados en este tipo de tablas, como editar el texto, intercambiar los datos de las filas y las columnas, aadir colores Para ello se selecciona la tabla en el visor y se hace doble-click con el ratn.

Doc. Juan Roberto Morales Romero

6. Editor de resultados de texto: Permite modificar los resultados de texto que no aparecen en las tablas, esto es, editar los resultados y cambiar las caractersticas de las fuentes (tipo, estilo, color y tamao).

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-4 7. Editor de sintaxis. Permite grabar y editar la sintaxis de los comandos seleccionados. Para ello hay que clicar sobre la opcin Pegar de los cuadros de dilogo, y la ventana de sintaxis muestra el cdigo correspondiente.

Figure 0-5 8. Editor de procesos: Permite crear y modificar los procesos bsicos.

Doc. Juan Roberto Morales Romero

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


1.2 Barra de Mens
El men principal tiene 10 opciones: 1. Archivo: Crea un nuevo fichero, abre uno existente, graba, lee datos de otras aplicaciones, guarda, imprime 2. Edicin: Contiene las opciones tpicas de Windows (copia, pega, busca). 3. Ver: Contiene opciones como Fuentes para modificar, tipo, tamao de letra Desde aqu tambin se pueden eliminar las lneas (cuadrcula) de la pantalla, asignar etiquetas de valores, ver barra de estado (situada en la base de la pantalla, indica el estado actual del proceso), modificar la barra de herramientas.... 4. Datos: Contiene opciones para hacer cambios que afectan a todo el archivo de datos como definir variables (nombre, tipo, etiquetas), insertar variables, trasponer variables y casos, unir archivos... Los cambios sern temporales mientras no se salve el archivo. 5. Transformar: Permite hacer cambios sobre variables seleccionadas del archivo de datos. Por ejemplo, calcula nuevas variables a partir de transformaciones numricas de variables existentes, asigna rangos 6. Analizar: Desde aqu se ejecutan todos los procedimientos estadsticos (tablas, regresin, pruebas paramtricas) . 7. Grficos: Permite la salida grfica de los datos o resultados (barras, lneas, reas, grficos de pareto, cartas de control, histogramas, diagramas de cajas). 8. Utilidades: Sirve para obtener informacin completa del archivo de datos... 9. Ventanas: Minimiza la ventana SPSS y muestra las ventanas abiertas. 10. Ayudas: Contiene distintos archivos de ayuda: por temas, tutorial, asesor estadstico

1.3 Procedimiento Bsico para un Anlisis Estadstico


Para llevar a cabo cualquier tipo de anlisis con SPSS hay que realizar tres operaciones bsicas: 1. Seleccionar un archivo de datos. 2. Seleccionar el procedimiento estadstico adecuado.

Doc. Juan Roberto Morales Romero

3. Seleccionar las variables a incluir en el anlisis y los parmetros adicionales.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

1.4 Cmo introducir los datos?


El SPSS reconoce archivos de datos creados por otros sistemas o aplicaciones. As, pueden importarse datos desde Excel o Lotus 1-2-3. Al igual que pueden tratarse con datos grabados en DBase. SPSS permite: 1. Leer los nombres de las variable de la primera fila en las hojas de clculo y en los archivos delimitados por tabuladores. 2. Especificar el rango de casillas que desee leer en los archivos de hojas de clculo. Si los datos sin formato se hallan en un archivo de slo texto (formato ASCII normal) ha de seleccionarse Leer datos de texto en el men Archivo. De cualquier manera, se puede utilizar el editor de datos de SPSS para introducir datos y crear lo que llamaremos un archivo de datos. (Archivo/Nuevo). Se pueden introducir o editar datos. Por defecto, SPSS crea y/o graba archivos sav . Cualquier . modificacin que se haga en el archivo de datos se mantendr slo durante el tiempo que dure la sesin, a no ser de que se salve explcitamente mediante Archivo/Guardar. Slo puede abrirse una archivo de datos cada vez, por eso SPSS cierra automticamente el archivo de datos de trabajo antes de abrir otro.

1.5 Definicin de variables


Las variables pueden ser definidas desde el Editor de datos. Esta ventana es la que se abre automticamente cuando se inicializa el SPSS. Los datos se representan en un formato de filas y columnas, donde cada fila es un nico caso u observacin (por ejemplo, cada persona en una encuesta) y cada columna es una nica variable (por ejemplo, una pregunta en una encuesta). Haciendo doble clic en la cabecera de la primera columna o en Datos/Definir variable, aparece el cuadro de dilogo de definicin de las variables.

Doc. Juan Roberto Morales Romero

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-1 En el cuadro se distingue: 1. Nombre de la variable: Por defecto asigna Var seguido de 5 dgitos. Puede introducirse un texto de hasta 8 caracteres que debe comenzar con letra y no debe acabar con punto. Tampoco puede tener blancos ni otros caracteres especiales. Dos variables no pueden llamarse de la misma manera. 2. Tipo: Por defecto SPSS asume que las variables son numricas, pero puede cambiarse el tipo por: Numrico (ancho mximo de 40 caracteres y 16 decimales); Coma (permite poner coma para separar los miles); Punto (cambia las comas por puntos); Notacin Cientfica, Fecha (se pueden utilizar barras, comas y puntos para separar das, meses y aos); Moneda y Cadena. 3. Etiquetas: Se pueden definir etiquetas de valor descriptivas para valores de datos. Por ejemplo, para el caso de la figura 7 se asigna a las etiquetas Administrativo, Seguridad y Directivo los valores 1, 2 y 3, respectivamente.

Figure 0-2

Doc. Juan Roberto Morales Romero

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


4. Valores perdidos: SPSS lo considera cualquier casilla en blanco como valor perdido, aunque tambin pueden definirse estos valores. Muchos anlisis estadsticos consideran la opcin de valores perdidos de dos formas: para excluir casos segn lista y para excluir casos segn pareja. En el primer caso, se eliminan los casos que tengan valores perdidos en cualquiera de las variables que estn indicadas en el anlisis. En el segundo, se eliminan los casos con valores perdidos de las dos variables que intervienen en el clculo del dato especfico que se est buscando. 5. Formato de columnas: Se puede cambiar el ancho de las columnas y la alineacin del texto que viene por defecto en el archivo de texto.

1.6 Edicin de datos


Los datos se introducen en el Editor de Datos. Para ello se selecciona la casilla o celda activa (que aparecer remarcada), se teclea el valor y se pulsa Enter. En el caso de introducir valores no numricos, previamente se habr elegido el tipo adecuado en la definicin de la variable (fecha, cadena) Con las opciones Datos/Insertar Variable y Datos/Insertar Casos se pueden aadir nuevas variables y nuevos casos al archivo. El programa sita la nueva variable o el caso en la posicin inmediatamente anterior a la celda activa. Puede modificarse cualquier dato introducido, as como elegir las opciones del men Editar: cortar, copiar, pegar, eliminar El men Ver ofrece la opcin Ver etiquetas de valor, que muestra las etiquetas de las categoras en vez de lo datos numricos.

1.7 Transformaciones sobre los datos


Transformar/Calcular: Asigna valores a una variable a partir de transformaciones numricas de variables existentes. Se puede escribir directamente la expresin aritmtica que generar la nueva variable o construirla con las funciones numricas que aparecen en la lista Funciones. Tambin puede establecerse una expresin condicional. Transformar/Recodificar: Permite modificar los valores de las variables, bien recodificndolos en la misma o en una nueva variable. Esto suele ser til para combinar o aadir categoras a una variable.

Doc. Juan Roberto Morales Romero

Transformar/Recodificacin automtica: Realiza la misma funcin que Recodificar, pero en este caso no especificamos nosotros los antiguos y nuevos valores, sino que el programa identifica los distintos valores de una variable y asigna un 1 para el primer valor, un 2 para el segundo Es muy til para recodificar variables texto en categoras numricas. Transformar/Semilla de aleatorizacin: Establece la semilla con la que el SPSS empieza a generar nmeros aleatorios.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

1.8 Manipulacin de archivos


Datos/Ordenar Casos: El archivo de datos se ordena de forma ascendente o descendente. Datos/Transponer: Intercambia filas y columnas. Datos/Agregar: Permite agrupar casos basndose en los valores de una variable de agrupacin y crear un nuevo archivo donde habr un caso por cada grupo. Aadiendo adems uardar el nmero de casos en G cada grupo en la variable se aade adems una nueva variable que contiene el nmero de casos encontrados en cada grupo. Datos/Segmentar Archivos: Permite definir una variable de agrupacin de casos. Para utilizar esta opcin el archivo debe estar ordenado por la variable de agrupacin. Datos/Seleccionar casos: A veces es interesante limitar los anlisis a submuestras. El SPSS permite seleccionar casos al azar, o siguiendo un determinado criterioUna vez seleccionados los casos puede elegirse qu hacer con los no seleccionados: filtrarlos o eliminarlos (estos casos no podrn volver a recuperarse). Datos/Fundir archivos: Permite unir archivos, combinando archivos con las mismas variables y distintos casos, o con distintas variables. Data/Ponderar Casos: Puede especificarse un factor de ponderacin para cada caso.

1.9 Grficos
Existen dos maneras de crear grficos, cada uno con su Editor de Grficos.

Doc. Juan Roberto Morales Romero

La primera de las dos formas consiste en seleccionar el tipo de grfico deseado en el men Grficos (barras, lnes, reas, sectores). Seleccionando Grficos/Galera se obtiene informacin sobre los tipos de grficos existentes. Una vez elegido el tipo de grfico y la manera de organizar los datos se pulsa en el botn Definir, de manera que aparece un nuevo cuadro de dilogo, en donde se introduce, entre otras opciones, la variable del eje de categoras. La grfica resultante aparece en el Visor. Clicando dos veces sobre sta se abre el Editor de Grficos, de manera que pueden realizarse modificaciones sobre la grfica. Por defecto el Editor muestra las barras de herramientas de grficos, aunque puedan aadirse ms o personalizar las barras. Para ello no hay ms que colocar el cursor sobre las barras y clicar con el botn derecho, de forma que aparece el men contextual. Tambin pueden realizarse modificaciones haciendo doble-click sobre cualquiera de los elementos de la grfica, apareciendo el cuadro de dilogo correspondiente.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-1 SPSS tambin ofrece la posibilidad de crear Grficos Interactivos. Para ello se elige Grficos/Interactivos y se elige el tipo de grfico, apareciendo el correspondiente cuadro de dilogo.

Doc. Juan Roberto Morales Romero

10

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-2 El cuadro de dilogo se compone de cuatro pestaas. Para crear un grfico basta con asignar las variables en Asignar Variables, pero se pueden utilizar las dems pestaas para personalizarlo. Las variables de los ejes se asignan arrastrndolas desde la lista de origen hasta los ejes de destino. Tambin se pueden arrastrar variables de un destino a otro. Si se coloca una variable en un destino con otra variable asignada, las variables intercambian su posicin. Se pueden asignar mltiples variables a los ejes pulsando la tecla Ctrl al mismo tiempo que el botn del ratn. El resultado del grfico aparece en el Visor. Pueden realizarse modificaciones sobre el grfico, activndolo clicando dos veces sobre l. Los grficos interactivos ofrecen funciones de edicin especiales que no aparecen en otros grficos, por ejemplo, la posibilidad de aadir variables y dimensiones adicionales a un grfico existente.

Doc. Juan Roberto Morales Romero

11

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


1.10 Tablas Pivote
Los resultados de este tipo de tablas pueden ser modificados en Editor de tablas pivote, al que se accede clicando dos veces sobre la tabla.
Tabla de contingencia Sexo * Clasificacin tnica * Categora laboral Recuento Categora laboral Administrativo Clasificacin tnica No S 110 47 166 276 14 14 70 10 80 40 87 13 13 4 4 Total 157 206 363 27 27 74 10 84

Sexo Total Sexo Total Sexo Total

Hombre Mujer

Seguridad Directivo

Hombre Hombre Mujer

Figure 0-1

Tomemos como base la tabla de la figura 10. Al pulsar dos veces en la tabla se activa el Editor que permite: 1. Obtener informacin sobre los resultados de la tabla Para ello hay que clicar con el botn derecho sobre el elemento deseado y elegir la opcin Qu es esto? del men contextual emergente.

2. Pivotar una tabla Tras clicar dos veces sobre la tabla se elige Pivotar/Paneles de pivotado. Aparece un cuadro de dilogo con iconos de pivotado sobre los paneles Capa, Fila y Columna. Al clicar sobre cada uno de estos iconos aparece un mensaje sealando qu representa cada uno de los iconos.

Doc. Juan Roberto Morales Romero

12

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-2 Puede modificarse la posicin y orden de los iconos, arrastrndolos de un panel a otro, de forma que la tabla vara.
Tabla de contingencia Sexo * Clasificacin tnica * Categora laboral Recuento Administrativo Sexo Hombre Mujer 110 166 47 40 157 206 Seguridad Sexo Hombre Total 14 14 13 13 27 27 Directivo Sexo Hombre Mujer 70 10 4 74 10

Clasificacin tnica Total

No S

Total 276 87 363

Total 80 4 84

Figure 0-3 En la figura 12 se ha traspuesto el orden de las filas y columnas con respecto a la tabla inicial de la figura 10. 3. Crear capas Los resultados de la tabla pueden mostrarse por capa. Esto es, puede mostrarse una tabla bidimensional en capas tridimensionales. Para ello se elige, como en el caso anterior, Pivotar/Paneles de pivotado y se arrastra los iconos de pivotado deseados de los paneles Fila o Columna al panel Capa. Por ejemplo, en la siguiente figura se ha trasladado Categora Laboral a la dimensin de Capa. As, los resultados son mostrados por categora, eligiendo sta segn el men desplegable emergente.

Doc. Juan Roberto Morales Romero

13

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-4 4. Editar elementos de la tabla Clicando sobre la celda o la etiqueta de la tabla que se quiere modificar, puede cambiarse el formato utilizando la barra de herramientas (Ver/Barra de herramientas). Tambin puede utilizarse Formato/Fuente para elegir opciones adicionales sobre la fuente y alineacin de la celda. Puede editarse cualquier valor de la tabla, teniendo en cuenta que si se cambia el valor de un elemento, los valores totales no se volvern a calcular. 5. Cambiar el formato de presentacin de la tabla Una vez abierto el Editor, se seleccionan las filas y columnas cuyo formato de presentacin quiere modificarse. Una vez seleccionadas, clicando con el botn derecho se elige la opcin Propiedades de casilla.

Doc. Juan Roberto Morales Romero

14

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-5 Aparece un nuevo cuadro de dilogo, donde pueden elegirse diferentes opciones entre las cuatro pestaas existentes. 6. Ocultar filas/columnas El Editor permite ocultar filas o columnas determinadas de la tabla. Para ello hay que teclear Ctrl+Alt sobre la etiqueta de la fila o columna a ocultar y, clicando el botn derecho, seleccionar Ocultar Categora del men contextual emergente. Por ejemplo, podran ocultarse los totales de las filas y columnas de la tabla inicial.
Tabla de contingencia Sexo * Clasificacin tnica * Categora laboral Recuento Categora laboral Administrativo Seguridad Directivo Clasificacin tnica No S 110 47 166 14 70 10 40 13 4

Sexo Sexo Sexo

Hombre Mujer Hombre Hombre Mujer

Figure 0-6

Doc. Juan Roberto Morales Romero

15

7. Personalizar el aspecto de la tabla

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Al elegir Formato/Aspectos de tabla aparece un cuadro de dilogo con los estilos de tabla disponibles. Tomando cualquiera de estos estilos como base, se realizan las modificaciones deseadas para crear estilos personalizados y se guardan con nombres nuevos, de forma que puedan ser utilizados en sesiones posteriores. Puede elegirse el aspecto de tabla por defecto en Edicin/Opciones, estableciendo en la pestaa Tablas pivote el nuevo aspecto a utilizar por defecto.

1.11 Procesos
Los procesos permiten automatizar muchas tareas para personalizar los resultados. Adems de procesos, pueden crearse autoprocesos, que son ejecutados automticamente cuando se crean tipos especficos de elementos a los cuales hacen referencia. Para ejecutar un proceso hay que seleccionar el elemento sobre el cual se quiere aplicar el proceso, elegir Utilidades/Ejecutar proceso y escoger uno de los procesos disponibles dentro de la carpeta Scripts. Asimismo, desde el Editor de Datos pueden crearse nuevos procesos en Archivo/Nuevo/Proceso, o editar los ya existentes en Archivo/Abrir, eligiendo archivos tipo Proceso de SPSS ( .sbs ). Para crear un autoproceso, primeramente hay que ejecutar el procedimiento que crea el tipo de elemento similar a los elementos que queremos que sean personalizados automticamente. En el Visor, hay que clicar con el botn derecho sobre el resultado y seleccionar Crear/Editar autoproceso en el men contextual desplegable. El lenguaje para editar los procesos es Sax Basic , compatible con Visual Basic. Sin embargo, no es objeto de este manual profundizar en temas de programacin. Puedes acudir a la propia ayuda del programa, consultando el Lenguaje de Procesos en el men Ayuda del Editor de Sintaxis.

Doc. Juan Roberto Morales Romero

16

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero 2 ESTADSTICA DESCRIPTIVA
2.1 Frecuencias. Histogramas
El procedimiento Analizar/Estadsticos Descriptivos/Frecuencias permite obtener una descripcin de la distribucin de una variable a partir de las tablas de frecuencias, histogramas y diagramas de barras y clculos de ndices de posicin y dispersin. Las tablas de frecuencias muestran: Frecuencia: Frecuencia absoluta de cada categora. Porcentaje: Frecuencia relativa, incluyendo los perdidos. Porcentaje Vlido: Frecuencia relativa, eliminando los perdidos. Porcentaje Acumulado: Frecuencia relativa acumulada, eliminando los perdidos. En Frecuencias:Grficos se puede seleccionar entre grficos de barras, grficos de sectores, histogramas con o sin curva normal y el tipo de datos que se quiere aparezca en el eje Y (Frecuencias absolutas o relativas). Las tablas de frecuencias y los grficos de barras de todos los valores de una variable son una forma adecuada de resumir una variable que tiene un nmero relativamente pequeo de valores. Para variables que pueden tomar muchos valores diferentes, como ingresos, preciosuna tabla de frecuencias para cada valor de la variable no tiene utilidad. La forma ms adecuada de representar esta distribucin en este caso es un histograma, agrupando los valores en intervalos. Los nmeros que aparecen debajo de cada barra indican el punto medio de cada intervalo. Los intervalos que no tienen ninguna observacin tambin estn incluidos en el grfico (a diferencia del grfico de barras, que no dejan espacio para categoras vacas). Si se quiere representar una tabla de frecuencias para estos intervalos, se debe previamente reconvertir la variable original en intervalos.

2.2 ndices de tendencia central y de posicin


En Analizar/Estadsticos Descriptivos/Frecuencias:Estadsticos aparecen los siguientes: 1. ndices de posicin ( valores percentiles)

Doc. Juan Roberto Morales Romero

17

Cuartiles: Calcula el valor que deja a la izquierda el 25% de los valores (Q 1), el que deja el 50% (Q 2 o mediana) y el que deja el 75% (Q 3). Puntos de corte para n grupos iguales: Muestra los valores de la variable que dividen la muestra en grupos de casos de igual tamao. Por defecto, divide la distribucin en 10 grupos iguales (halla los deciles). Los cuartiles se obtienen cuando se divide en 4 partes iguales. Percentiles: Calcular algn centil especfico. 2. ndices de tendencia central Media: Media aritmtica. Mediana: Valor por debajo del cual est el 50% de los casos. Moda: Valor que ms se repite Suma: Suma de todos los valores 3. ndices de dispersin (Dispersin) Desviacin Tpica: Variabilidad de los valores con respecto a la media, expresada en las mismas unidades que los datos. Varianza: Variabilidad de los valores con respecto a la media, expresada en unidades al cuadrado. Amplitud: Diferencia entre los valores mximo y mnimo. Mnimo: Valor ms pequeo. Mximo: Valor ms grande. E.T. media: Error tipo de la media. Estimacin de la variabilidad muestral de la media. 4. ndices de distribucin Asimetra: Coeficiente de asimetra. Curtosis: Coeficiente de curtosis. Algunas de estas medidas tambin se hallan en Analizar/Estadsticos Descriptivos/Descriptivos. En el cuadro de dilogo se seleccionan las variables, y en Opciones puede elegirse calcular la media, suma, desviacin tpica, amplitud, mnimo, mximo, coeficientes de curtosis y asimetra.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

2.3 Representacin en tablas


Sirve para representar los datos de variables en forma tabulada. As, en Analizar/Tablas personalizadas/Tablas bsicas aparece un cuadro de dilogo en el que debe introducirse:

Doc. Juan Roberto Morales Romero

18

Hacia abajo: La variable o variables que aparecern por filas. A travs: Variable o variables que irn en columnas.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Tablas distintas: La variable de separacin de tablas, si se desea (p.e.,. Sexo). Se puede elegir, adems, dos opciones: Todas las combinaciones (anidadas) o Cada una por separado (apiladas). En el primero de los casos, en las dos o ms variables que se tienen por filas o columnas, se combinan o juntan las categoras, mientras que en el caso de las apiladas se diferencias las categoras, esto es, cada categora aparece por separado. Por ejemplo, suponga que tiene una tabla con dos variables en las columnas: sexo (hombre y mujer) y estado (soltero, casado...) y una variable en las filas: aspecto que ms le preocupa (su vida afectiva, el dinero). Al utilizar la opcin de todas las combinaciones anidadas obtiene la primera tabla y al utilizar la opcin de apiladas obtiene la segunda tabla.

Figure 2-1

Figure 2-2

Doc. Juan Roberto Morales Romero

19

Tambin se puede elegir qu estadsticos quieren observarse en las celdas de la tabla, desde la frecuencia o nmero de observaciones en valores absolutos, valores relativos, porcentajes, medias, desviaciones... Asimismo puede elegirse el formato de salida. Es aconsejable usar la opcin de tablas de frecuencias cuando lo que se quiere analizar son los resultados de una serie de variables que tienen las mismas categoras de respuesta. En Analizar/Tablas personalizadas/Tablas de frecuencias, en el campo Frecuencias parase detalla la variable sobre la cual se quiere visualizar las frecuencias. En En cada tablase introducen las variables que crean los subgrupos dentro de la tabla. Al igual que en las tablas bsicas, los resultados pueden mostrarse anidados o apilados.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

3 REGRESIN Y CORRELACIN
Estas tcnicas estadsticas sirven para estudiar la existencia o no de relacin entre dos variables y, en el supuesto de que exista, ver si es lineal positiva o negativa, exponencial Para cuantificar el grado de relacin lineal entre dos variables se utilizar el coeficiente de correlacin de Pearson, coeficiente que oscila entre -1 y 1, indicando con 0 la relacin nula y con 1 o -1 la relacin perfecta positiva o negativa, respectivamente.

3.1 Correlacin
En Analizar/Correlaciones/Bivariadas aparece un cuadro de dilogo donde pueden elegirse las variables que queremos relacionar, el coeficiente de correlacin y el test de significacin (unilateral o bilateral, este ltimo por defecto). Para el coeficiente de correlacin, el programa da tres opciones: el de Pearson, por defecto, la correlacin de Spearman, que se suele utilizar para datos ordinales o de intervalos, y el de Kendall, muy parecido al anterior. Aparecern tres valores: 1. el primer valor es el coeficiente de correlacin, segn el elegido. 2. el segundo valor es el grado de significacin de cada coeficiente, que da un grado de confianza del resultado obtenido. Usualmente se trabaja con niveles que van desde 0,05 a 0,01, es decir, se trabaja con un grado de confianza del 95% al 99%. 3. el tercer valor hace referencia a las observaciones que han intervenido en el clculo de la relacin.

Doc. Juan Roberto Morales Romero

20

En el cuadro de dilogo aparece la opcin Marcar las correlaciones significativas. Si esta opcin se selecciona aparecen con un * los valores que tienen un nivel de significacin inferior a un 0,05, y con dos ** los de nivel inferior a 0,01. Lgicamente si el coeficiente se calculara no con una muestra de valores sino con toda la poblacin el grado de significacin sera 0. En Opciones se pueden seleccionar estadsticos adicionales como medias, varianzas, covarianzas... Existe otro coeficiente de correlacin en Analizar/Correlaciones /Parciales que da una idea de la relacin lineal existente entre dos variables, pero ajustada a los efectos lineales que sobre la misma puedan tener una o ms variables intervinientes. Grficos/Dispersin da la opcin de graficar los datos para ver grficamente la posible relacin entre las variables.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 3-1 Existen 4 opciones: 1. Simple: Cada punto del grfico representa un sujeto de la base de datos con sus valores representativos en dos variables. 2. Matricial: Una matriz cuadrada de diagramas de dispersin simple que muestra todos los pares posibles entre las variables seleccionadas. 3. Superpuesto: Representa dos o ms parejas de variables Y-X dentro del mismo marco. 4. 3-D: Es la representacin de la relacin de tres variables. Se puede rotar el grfico. En Definir se debe decir qu variable aparece en el eje Y (acta como dependiente) y cul o cules en la X (independiente). Existen las opciones Establecer marcas por una variable que clasifique los individuos por grupos y Etiquetar los casos mediante, una variable que con sus valores o categoras identifique a cada sujeto en el grfico. Presionando el botn de Opciones aparece: Mostrar los grupos definidos por los valores perdidos: Muestra o no los puntos del grfico separado por los distintos subgrupos de la variable introducida en Establecer marcas por .

Doc. Juan Roberto Morales Romero

21

Mostrar el grfico con las etiquetas del caso: Aparecen las etiquetas por cada punto del grfico de acuerdo a la variable de Etiquetar los casos mediante.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

3.2 Regresin Lineal Simple


El procedimiento que se desarrolla en Estadsticos/Regresin/Lineal pretende ajustar los datos a un modelo de regresin simple:

Yi = 0 + 1 X i + e i
donde o y 1 son desconocidos y deben ser estimados con los datos y e i es el trmino del error, es decir, la diferencia entre los valores predichos por la regresin y los reales. Este ajuste se realiza a travs de una anlisis de varianza que requiere los siguientes supuestos: 1. La normalidad e igualdad de varianzas tanto de la variable dependiente como la independiente. 2. La independencia de la variable Y. 3. La linealidad en la relacin entre las variables. En el cuadro de dilogo de Estadsticos de Regresin Lineal, aparece la opcin Ajuste del modelo, que muestra la R mltiple, la R cuadrado, la R cuadrado corregida y el error tpico. Una tabla ANOVA muestra los grados de libertad, las sumas de cuadrados, el valor de F y el nivel crtico de F. Los resultados en los que nos fijaremos son: 3.2.1 Coeficientes de correlacin R Mltiple : Es el coeficiente de correlacin de Pearson. R Cuadrado: Es el cuadrado del anterior y una buena medida del ajuste del modelo a los datos. Se podra traducir como la proporcin de la variacin de la variable dependiente que es explicada por el modelo. R Cuadrado corregido: Vara un poco del anterior, porque est calculado ajustado al nmero de variables independientes del modelo. 3.2.2 Anlisis de la varianza (ANOVA) El nivel de significacin es la forma de probar la no existencia de relacin lineal significativa entre las variables X e Y. Si este valor es mayor que 0,05, se debe rechazar la hiptesis de linealidad entre ambas

Doc. Juan Roberto Morales Romero

22

variables. Si es menor a este valor, se aceptar como vlida esta relacin con un nivel de significacin del 95%. En este caso, los valores de 0 y 1 aparecen al final del resultado bajo la letra B. El mtodo de ajuste a la recta es el de mnimos cuadrados. Una vez aceptada la hiptesis de linealidad y obtenida la recta que relaciona estas variables se debe validar el modelo y, una vez validado, utilizarlo para poder hacer predicciones. Para eso, en el mismo cuadro de dilogo donde hemos introducido las variables a estudiar, existe un botn Guardar a partir del cual sale una pantalla donde se deben seleccionar las opciones Valores pronosticados /Tipificados y Valores pronosticados/ No tipificados y, Residuos Tipificados Al final de los resultados el programa advierte que ha generado tres nuevas variables cuyos nombres y contenidos son: PRE_1: Valores pronosticados. Da la prediccin puntual para un xi concreto a partir de la ecuacin de la recta de regresin obtenida ZPR_1: Valores pronosticados tipificados. Aparecen los valores predichos estandarizados ZRE_1: Residuos tipificados. son los residuales de la regresin, es decir, la diferencia entre los valores de Y y los predicho a travs de la recta tambin tipificados. Para validar el modelo analizado, ha de comprobarse si se cumplen las hiptesis que el procedimiento exige y que se han expuesto al principio: 1. La linealidad en la relacin entre las variables: para ver si se cumple se puede generar un Diagrama de dispersin entre los ZPR_1 como variable independiente y los ZRE_1 como dependiente. Para verificar esta relacin, los residuales deben fluctuar alrededor de la recta que corresponde a la media de los mismos y que debe de ser 0. 2. En cuanto a la igualdad de varianzas, este mismo grfico puede servir para contrastar hasta qu punto esta hiptesis se viola. Si la variabilidad de los residuales se mantiene ms o menos constante, se puede concluir que se cumple la hiptesis. 3. La normalidad puede estudiarse a travs de los residuos. Los residuos deben ajustarse a una normal y para comprobarlo basta con construir un histograma con los mismos. Si a travs de estas comprobaciones descubrimos que alguno de estos supuestos ha sido violado, no debemos utilizar la recta obtenida como ajuste a los datos porque el modelo no ha sido utilizado de manera correcta. Usualmente la transformacin de variables, ya sea logartmica, raz cuadrada, recprocasuele

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Doc. Juan Roberto Morales Romero

23

ayudar a estabilizar la varianza, aumentar la aproximacin de los datos a una normal o ajustar la relacin a una funcin lineal.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

3.3 Estimacin de la curva


Adems del modelo lineal que acabamos de ver, dos variables pueden estar relacionadas a travs de otras curvas: exponencial, logartmica, polinmica, Entrando en Analizar/Regresin/Estimacin Curvilnea aparece un cuadro de dilogo donde hay que elegir la variable dependiente y la independiente y donde se puede seleccionar distintos modelos de curvas a las que ajustar los datos de las variables seleccionadas. Como resultado se obtendr el R2 para cada modelo, el grado de significacin del ajuste y los coeficientes b 0 , b 1 entre otros. Para la seleccin del modelo ms adecuado conviene fijarse en el nivel de significacin y en el R 2 de cada modelo. A igualdad de condiciones, los modelos cuadrticos y cbicos darn un R 2 superior al lineal por el simple hecho de estimar con ms coeficientes. En cambio, si este incremento no es sustancial, no compensa trabajar con un modelo ms complejo. Al igual que en la regresin lineal es interesante llevar a cabo un anlisis detallado de los residuales y comprobar su aleatoriedad, normalidad

4 TABLAS DE CONTINGENCIA
Las tablas de contingencia sirven para contrastar la hiptesis de independencia entre dos caractersticas en las que se divide una poblacin. Es decir, es una manera de ver si podemos admitir la existencia de relacin o no entre esas dos caractersticas. Es de gran utilidad para establecer relaciones entre caractersticas cualitativas, donde no puede realizarse un anlisis de regresin y correlacin.

4.1 Formato de las tablas


Entrando en Analizar/Resumir/Tablas de contingencia, aparece el cuadro de dilogo correspondiente al procedimiento de tablas de contingencia. En l hay que elegir la variable que formar las filas de la tabla y la que formar las columnas. En el botn Casillasaparece otro cuadro donde se puede elegir:

Doc. Juan Roberto Morales Romero

24

Frecuencias observadas y esperadas: Es decir, frecuencia observada o esperada de cada celda de la tabla. Porcentajes: Por fila, columna o sobre el total de la tabla. Residuos: No tipificados (diferencias entre las frecuencias observadas y las tericas), Tipificados (esta diferencia entre la raz cuadrada de la terica) y Tipificados corregidos (la diferencia entre una estimacin del error) En el botn Formato podemos seleccionar: Orden de las filas: Ascendente o descendente. En el botn Estadsticos obtenemos otro cuadro donde slo nos fijaremos en: Chi-cuadrado: Valor de la chi cuadrado con sus grados de libertad y el nivel de significacin obtenido.

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

4.2 Representaciones grficas


Entrado en Grficos/Barras aparece un cuadro de dilogo donde vemos tres tipos de grficos de barras, simples, agrupadas o apiladas. Adems los datos pueden hacer referencia a resmenes para grupos de casos, resmenes para variables separadas y valores individuales. Clicando sobre el botn Definir se abre un cuadro de dilogo, donde se puede elegir lo que deben representar las barras: nmero de casos, nmero acumulado de casos, porcentaje, porcentaje acumulado y tambin se elige la variable del eje de categoras. Esta representacin grfica, siempre da una idea de lo que observamos en el anlisis de una tabla de contingencia.

Relacin entre dos Variables

En muchas situaciones que se presentan a menudo en el campo de la ciencia, la ingeniera o las ciencias econmicas nos encontramos con el problema de la relacin entre dos variables numricas. Por ejemplo, la relacin entre la temperatura de un paciente y el nmero de pulsaciones por minuto o la relacin

Doc. Juan Roberto Morales Romero

25

entre el costo de un producto y el costo de la mano de obra para fabricarlo. Muchas veces existen ecuaciones matemticas que nos permiten calcular una variable conociendo el valor de otra de la cual depende. En general, cuando se nos presentan dos variables numricas X e Y, podemos encontrar distintos tipos de relacin entre ellas. Puede ocurrir que entre ellas no exista ningn tipo de relacin. En tal caso, la variacin de una de ellas no genera una variacin correlativa en la otra. Variacin correlativa significa que cada vez que X aumenta, Y debe aumentar si hay correlacin positiva o cada vez que X aumenta, Y debe disminuir en caso de correlacin negativa. Pero si cada vez que X vara, Y puede aumentar o disminuir al azar en cualquier grado y proporcin, entonces significa que no hay ninguna correlacin entre ambas:

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Ninguna correlacin
50 45 40 35 30 25 20 15 10 5 0 0 2 4 6 Variable X 8 10 12

Cuando hay una relacin funcional entre X e Y, es decir Y=F(X), la correlacin entre ambas es perfecta. Supongamos que medimos el valor de Y para un determinado valor de X, y que dicho valor de X lo podemos fijar con exactitud (En general, esto no va a ser cierto). La ecuacin de la funcin nos da un valor de Y para ese valor de X. El valor de Y medido y el valor de Y calculado con la ecuacin, en general, no van a coincidir. Si repitiramos la medicin de Y muchas veces para el mismo valor de X, tendramos una serie de valores que son diferentes del valor calculado. Pero si seguimos este proceso, obtendremos una poblacin de valores de Y cuyo promedio s va a coincidir con el valor calculado. Es decir, la relacin funcional expresada

Doc. Juan Roberto Morales Romero

Variable Y

26

por la ecuacin matemtica se cumple para los promedios de los X e Y medidos, porque la mediciones individuales estn sujetas al error experimental o error de medicin. Vemoslo con un ejemplo. Si dejamos caer una pelotita desde el borde de una mesa, la distancia que recorre desde el borde hasta tocar el suelo se puede calcular por medio de la ecuacin siguiente:

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Y = f (t) =

1 g t2 2

g Aceleracion Gravitatoria

Hay una relacin funcional no lineal entre la altura Y desde la cual cae la pelotita y el tiempo t que tarda en caer, expresada por la ecuacin anterior. Si dejamos caer la pelotita midiendo con un cronmetro el tiempo que tarda en llegar al suelo y medimos tambin la distancia recorrida (la altura de la mesa), los valores resultantes de la medicin seguramente no cumplen con esa relacin. Esto lo podemos verificar reemplazando t en la ecuacin por el tiempo obtenido con el cronmetro. El valor resultante Y seguramente no va a coincidir con nuestra medicin de la altura de la mesa. Si repetimos esto muchas veces, las mediciones de tiempo y distancia realizadas en cada ocasin, en general, no van a cumplir la relacin. Pero si promediamos todas la mediciones de tiempo y luego reemplazamos t en la ecuacin por este promedio, la distancia calculada con la ecuacin s va a coincidir con el promedio de todas las mediciones de altura de la mesa. Entre las dos posibilidades extremas, la de no tener ninguna relacin entre las variables y la de tener una relacin funcional, hay infinitas situaciones intermedias, en las cuales hay un cierto grado de correlacin entre ambas:

Doc. Juan Roberto Morales Romero

27

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


Hay alguna correlacin
50 45 40 35 30 25 20 15 10 5 0 0 2 4 6 Variable X 8 10 12

En muchos problemas prcticos de la industria y de la economa se trata de conocer en forma emprica la relacin entre dos variables, de tal manera que si se tiene un valor de la variable X se pueda obtener por clculo o en forma grfica el valor de la variable Y, sin importar si existe una verdadera relacin funcional entre ambas variables. Por ejemplo, supongamos que tenemos una grupo muy grande de personas de sexo masculino, de edad entre 30 y 40 aos. Se nos presenta el problema de relacionar las variables peso y estatura, de tal manera que, conociendo la estatura en metros de un individuo del grupo, podamos calcular su peso en Kg. Entre ambas variables no existe una relacin funcional. Esto lo vemos fcilmente si tomamos algunos individuos cuya estatura sea la misma, por ejemplo, 1,75 mts. y medimos el peso de cada una. Resulta claro que las mediciones van a ser diferentes, una pesar 73 Kg., otra 79 Kg., etc. y estas diferencias no se deben al error de medicin, sino a diferencias reales en el peso de las personas:

Doc. Juan Roberto Morales Romero

Variable Y

28

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


Grfico de peso vs. altura
130 120 110 Peso (Kg.) 100 90 80 70 60 50 40 1,60 1,70 1,80 1,90 2,00 2,10

Peso de personas de 1,75 mts.

Altura (mts.)

Quiere decir que para un determinado valor de la variable estatura podemos encontrar mltiples valores de la variable peso, lo cual niega la existencia de relacin funcional. No obstante, existe un importante grado de correlacin entre ambas variables, porque sabemos que a medida que aumenta la estatura de las personas dentro del grupo, el peso tiende a aumentar. Cmo podemos hacer, entonces, para estimar el peso de una persona conociendo su estatura? Para ello, vamos a suponer un procedimiento hipottico: Tomamos del grupo un nmero muy grande de personas que miden exactamente 1,65 mts., las pesamos y promediamos los resultados. Repetimos el procedimiento para grupos que miden 1,70 mts., 1,75 mts., etc. y luego representamos grficamente los promedios de peso en funcin de dichas alturas:

Doc. Juan Roberto Morales Romero

29

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


Regresin del peso sobre la altura
130 120 110 Peso (Kg.) 100 90 80 70 60 50 40 1,60 1,70 1,80 1,90 2,00 2,10

Altura (mts.)

La representacin resultante se denomina Regresin del peso sobre la altura, y a la ecuacin correspondiente Ecuacin de Regresin. Una vez hecho esto, disponemos de una forma sencilla de estimar el peso de una persona del grupo conociendo la altura: con la misma entramos al grfico y obtenemos el valor de Y correspondiente. Este valor Y es el promedio de los pesos de las personas del grupo que miden una altura X, y slo nos sirve como una estimacin (aproximacin) del peso real de la persona cuyo peso deseamos conocer. Tambin podemos utilizar la ecuacin de regresin para calcular el peso. La forma de la representacin grfica puede ser una recta u otro tipo de curva. Cuando es una recta decimos que es una regresin lineal, y de ahora en mas nos referiremos a este tipo de regresiones. El procedimiento real para obtener la regresin utiliza un mtodo que se conoce como Mtodo de los Cuadrados Mnimos. Se toma una muestra aleatoria de personas del grupo que cubran todo el rango de alturas y a cada una se le mide el peso y la altura. Si representamos estos puntos en un grfico, veremos que se agrupan aproximadamente alrededor de una recta imaginaria, que representa los puntos de la regresin. Parece lgico pensar que la recta de la regresin debe pasar muy cerca de los puntos experimentales (las mediciones que realizamos). Si hacemos pasar esta recta imaginaria por el punto correspondiente a uno de los individuos la estamos alejando, probablemente, de los otros puntos. Es decir que, la recta de regresin debe pasar a una distancia ptima de los puntos experimentales, de tal manera que est lo mas cerca posible

Doc. Juan Roberto Morales Romero

30

de todos ellos. Esto es lo que se trata de hacer con el mtodo de los cuadrados mnimos. Entonces, tenemos una serie de valores de la variable X, para cada uno de los cuales se mide la variable Y:

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

X X1 X2 X3 X4 X5 X6 etc.

Y Y1 Y2 Y3 Y4 Y5 Y6

La ecuacin de la recta de regresin ser de la forma:

Y R = a + bX
Si ingresramos en esta ecuacin los valores X 1 , X 2 , X 3 , etc. obtendramos los valores de Y de la regresin:

Y1 R , Y2R , Y3R , etc. Las diferencias entre estos valores calculados y los valores Y medidos se denominan
residuos :

(Y (Y (Y

1 R 2 R 3

) Y ) Y )
Y1
2 3

............... etc.

Doc. Juan Roberto Morales Romero

31

Si elevamos las diferencias o residuos al cuadrado y sumamos estos cuadrados, obtenemos una cantidad denominada suma de cuadrados alrededor de la regresin:

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


(Y
R

Yi = (a + b X i ) Yi

De todas las rectas posibles que pasan por los puntos representados en el grfico, la recta de regresin debe ser la que haga mnima esa suma de cuadrados. Observemos que en dicha suma de cuadrados conocemos los valores X i , Y i (Son la mediciones que realizamos) y deseamos conocer a y b, que son los coeficientes de la ecuacin de regresin. Para obtenerlos se calcula el mnimo de la suma de cuadrados y de las ecuaciones resultantes se despejan las frmulas de ambos coeficientes, que son como sigue:

b=

n X i Yi X i Yi n X 2

( X )
i

a = Y b X

donde

X=

X
n

Y=

Y
n

son los promedios de Xi e Y i respectivamente y n es el nmero de pares de observaciones X i , Y i . Ahora bien Cmo podemos conocer cual es el grado de vinculacin entre ambas variables? Para ello, calculamos el Coeficiente de Correlacin, que es un nmero real entre 0 y 1 que nos da el grado de correlacin entre dos variables X e Y. Cuando este coeficiente es 0, la correlacin entre ambas variables no existe; cuando es 1, hay una correlacin perfecta, es decir, tenemos una relacin funcional entre ambas. El coeficiente de correlacin es el cociente entre la Covarianza y las desviaciones standard de X e Y:

Doc. Juan Roberto Morales Romero

32

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


Cov( X , Y ) = s X sY

R=

( X

( X
i

X Yi Y
2 i

) (Y Y )

)(

Funciones Estadsticas del EXCEL


La funcin ESTIMACION.LINEAL permite calcular los coeficientes de la recta de regresin lineal de un conjunto de datos X, Y. Veamos el siguiente ejemplo:

Los datos X, Y estn en el rango A2:B13 de la planilla. Seleccionamos el rango D2:E2 para colocar los coeficientes de la recta de regresin. Luego tipeamos el signo igual, el nombre de la funcin

Doc. Juan Roberto Morales Romero

33

Estimacion.Lineal y dentro de los parntesis los parmetros. Los dos primeros parmetros son los rangos B2:B13 y A2:A13 donde se encuentran los valores de Y y X respectivamente. El tercer parmetro debe tomar el valor Verdadero si se desea que calcule la ordenada al origen ( also en caso contrario). Y el cuarto F parmetro debe tomar el valor Verdadero si se desean estadsticas adicionales como el coeficiente de correlacin, sumas de cuadrados, etc. (Falso en caso contrario). Una vez ingresados los parmetros, se debe mantener oprimidas simultneamente las teclas SHIFT y CTRL, y luego oprimir ENTER para ingresar la funcin. En la celda D2 aparecer la pendiente y en E2 la ordenada al origen de la recta de regresin. Otra funcin relacionada es TENDENCIA, la cual es una funcin matricial que calcula la regresin lineal para una serie de puntos X, Y, pero en lugar de devolver los coeficientes de la regresin retorna los valores de Y calculados para una serie de valores de X que se le pasan como parmetros. Las funciones INTERSECCIN y PENDIENTE retornan la ordenada al origen y la pendiente para una serie de puntos X, Y. La funcin PRONOSTICO retorna el valor Y correspondiente a un valor X que se le da como parmetro, junto con una serie de puntos X, Y. La funcin COEF.DE.CORREL retorna el coeficiente de correlacin entre dos conjuntos de valores X, Y. La funcin PEARSON retorna el mismo valor que COEF.DE.CORREL. PROMEDIO El EXCEL dispone de un conjunto muy completo de funciones que permiten realizar clculos estadsticos. Estas funciones pueden utilizarse a travs de 2 caminos. El primero consiste en ingresar la funcin en la barra de frmulas, junto con los parmetros apropiados para el caso. El segundo camino es utilizar el asistente para funciones , el cual presenta una ventana para guiar al usuario en el ingreso de los parmetros necesarios. Vamos a ejemplificar ambos mtodos con la funcin PROMEDIO. Supongamos que tenemos 5 nmeros en el rango de celdas A1:A5 cuyo promedio deseamos obtener:

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Doc. Juan Roberto Morales Romero

34

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

En primer trmino, nos situamos en la celda en la cual queremos colocar el promedio, en este caso, la celda A7. A continuacin, tipeamos en la Barra de Frmulas el signo igual, el nombre de la funcin, y entre parntesis los parmetros necesarios, en este caso el rango A1:A5. Luego, con el mouse hacemos clic en el Cuadro de Introduccin o presionamos ENTRAR. El promedio de los valores numricos que se encuentran en

el rango A1:A5 aparecer en la celda A7:

Doc. Juan Roberto Morales Romero

35

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero


Si queremos utilizar el asistente para funciones, hacemos clic en el botn correspondiente al mismo y aparecer una ventana para elegir la funcin que deseamos:

Con el mouse hacemos clic en Estadsticas y luego doble clic en PROMEDIO. En el paso siguiente aparecer una ventana para ingresar los parmetros de la funcin:

Doc. Juan Roberto Morales Romero

36

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Ingresamos el rango donde estn los valores, A1:A5 y hacemos clic en el botn Aceptar, con lo cual aparece el promedio calculado en la celda A7. Vamos a ver ahora como hacer para calcular una distribucin de frecuencias a partir de un conjunto de observaciones. El Excel posee una funcin, que se llama FRECUENCIA, la cual genera una tabla con la distribucin de frecuencias. Se trata de un funcin matricial, por lo que su forma de trabajar es diferente de las funciones comunes del Excel. Para ilustrar su uso, vamos a recurrir nuevamente a un ejemplo. Supongamos que tenemos un conjunto de datos en el rango A2:C11:

Doc. Juan Roberto Morales Romero

37

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

En una columna adicional construmos una serie de intervalos que cubran aproximadamente desde el valor mnimo hasta el valor mximo de nuestra poblacin de datos. En nuestro caso, construmos intervalos de 5 unidades, desde 65 hasta 90 y los colocamos en el rango E2:E8. Luego seleccionamos con el Mouse un rango de celdas en la columna de la derecha, junto a los intervalos, pero con una celda ms (F2:F9). A continuacin, tipeamos en la barra de frmulas el signo igual, el nombre de la funcin FRECUENCIA y dentro de parntesis el rango donde estn los datos de la poblacin (A2:C11) y el rango de los intervalos (E2:E8), separados por punto y coma.

Doc. Juan Roberto Morales Romero

38

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Una vez hecho esto, se mantienen oprimidas simultneamente las teclas SHIFT y CTRL, y luego se oprime ENTER. En el rango de celdas seleccionadas aparecer la distribucin de frecuencias de la poblacin. En la barra de frmulas, la funcin aparece encerrada entre 2 llaves, debido a que se trata de una funcin matricial. Si se desea borrar la distribucin de frecuencias, se deben seleccionar todas las celdas (F2:F9) y oprimir la tecla DELETE.

Doc. Juan Roberto Morales Romero

39

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

La funcin Frecuencia cuenta el nmero de observaciones menores o iguales que 65, mayores que 65 y menores o iguales que 70, etc. La celda adicional es para registrar el nmero de observaciones mayores que 95, que en este caso es 0. Las funciones VAR y VARP permiten calcular la varianza de una muestra y la varianza de una poblacin respectivamente (Recordar la diferencia entre ambas frmulas). Las funciones DESVEST y DESVESTP calculan la desviacin standard de una muestra y la desviacin standard de una poblacin. La funcin DESVIA2 sirve para calcular una suma de diferencias entre el promedio de un conjunto de observaciones y las observaciones individuales, elevadas al cuadrado. Esta suma de cuadrados dividida por el nmero de grados de libertad nos da la varianza.

Doc. Juan Roberto Morales Romero

40

Doc. Juan Roberto Morales Romero

También podría gustarte