Está en la página 1de 8

Iniciacin al uso de STATISTICA 8.3 para resolver problemas elementales.

Prcticas con STATISTICA

pgina 2

Iniciacin al uso de STATISTICA 8.3 para resolver problemas elementales.


El programa STATISTICA, es un software estadstico muy potente, verstil y que nos permite compatibilizar nuestros resultados para utilizarlos sin problemas en otros programas. Sin embargo, puesto que esto es un curso de iniciacin, y los conocimientos de estadstica de los estudiantes a los que va dirigido son muy elementales, lo que se pretende con estas notas no es dar un manual de STATISTICA, ni sacar el mayor aprovechamiento posible del programa, sino aprovechar este programa para realizar los clculos estadsticos ms elementales. El objetivo del curso (7 u 8 sesiones de 2 horas) es, aprender a manejar el programa con soltura suficiente para realizar sin problemas, al menos, las siguientes acciones: 1. 2. 3. 4. 5. 6. 7. cmo crear un fichero de datos cmo obtener unos estadsticos descriptivos cmo obtener resultados seleccionando, segmentando y ponderando cmo realizar un anlisis bidimensional: regresin y correlacin cmo realizar los grficos ms elementales y algunas modificaciones sencillas cmo calcular probabilidades cmo realizar un contraste de hiptesis

Insisto en que no vamos a ver todas las posibilidades del programa (eso se deja para aquellos que estn interesados o para ms adelante), sino cmo resolver un problema de forma sencilla. Debe quedar claro que esto no es ms que un curso de iniciacin. Por otra parte, no debemos olvidar que estas prcticas forman parte de una asignatura de Estadstica, por lo que no slo nos interesa obtener resultados sino tambin interpretarlos.

Profesoras: Zenaida Hernndez Martn y Montserrat San Martn Prez Despacho: 227 del edificio VIVES Telfono: 941299444 Correo electrnico: zenaida.hernandez@unirioja.es y montse.sanmartin@unirioja.es Web: http://www.unirioja.es/cu/zehernan

Prcticas con STATISTICA

pgina 3

Tema 1: Cmo crear un fichero de datos


Creacin de un fichero de datos:
Para poder llevar a cabo cualquier anlisis estadstico, debemos disponer de una masa de datos que es la que queremos analizar. Si el estudio se va llevar a cabo utilizando cualquier software estadstico, los datos objeto de estudio deben estar almacenados en un fichero apropiado. El software STATISTICA almacena los datos en unos ficheros que son como hojas de clculo (spreadsheet) y que nombra con la extensin .sta. Ojo!, los ficheros *.sta no se usan exclusivamente para almacenar datos susceptibles de un anlisis estadstico, sino que en ellos se puede almacenar tambin otro tipo de informacin, por lo que debemos tener muy claro cual es el contenido de nuestro fichero. Supongamos que disponemos de la siguiente informacin que queremos analizar: Progresin de los 100 metros lisos masculinos (cronometrados electrnicamente): Marca 9.95 9.93 9.92 9.90 9.86 9.85 9.84 9.79 9.77 9.74 9.72 9.69 Atleta Jim Hines Calvin Smith Carl Lewis Leroy Burrell Carl Lewis Leroy Burrell Donovan Bailey Maurice Greene Asafa Powell Asafa Powell Usain Bolt Usain Bolt Fecha de la marca 14/10/1968 3/07/1983 30/08/87 14-06-91 25-08-91 06-07-94 29-07-1996 16-06-99 14-06-2005 9-09-2007 31-05-2008 16-08-2008 Nacionalidad EEUU EEUU EEUU EEUU EEUU EEUU Canad EEUU Jamaica Jamaica Jamaica Jamaica

Para poder hacer cualquier anlisis con estos datos debemos crear un fichero de datos adecuado. Tenemos distintas opciones: a) crear directamente el fichero con STATISTICA: a. abrimos la aplicacin b. File/Nuevo/spreadsheet i. Especificamos 4 variables y 11 casos (como todas las variables son diferentes, el resto de las caractersticas las definiremos ms adelante). ii. Colocar, como una ventana independiente c. Doble clic en el nombre de la primera variable, (vamos a ir definindolas todas): i. Var 1 --> Marca; Nmero con 2 decimales ii. Cambiamos de variable pulsando en >> iii. Var 2--> Atleta; tipo Texto; longitud 20; >> iv. Var 3 --> Fecha marca; formato Date (elegir el 2 formato todas las fechas deben estar en el mismo formato); >> v. Var 4 --> Nacionalidad; Text Labels (codificamos los valores)

Prcticas con STATISTICA

pgina 4

d. Ahora introducimos todos los datos (o los copiamos y pegamos). e. Guardamos nuestros datos con el nombre atletas.sta

b) Otra opcin es importar el fichero desde otra aplicacin (por ejemplo, si tenemos los datos en una hoja de Excel: empresa.xls): a. abrimos la aplicacin b. File/Abrir/buscamos ficheros con formato Excel (*.xls) i. Importamos como una hoja de clculo, la hoja 1 del libro (si es all donde tenemos los datos que nos interesan):

ii. Especificamos el rango: (por defecto selecciona todas las filas y columnas escritas en la hoja de excel). iii. Importante: sealar Tomar los nombres de la primera fila, iv. Importar el formato de las celdas

Prcticas con STATISTICA

pgina 5

c. Si alguna variable no tiene el formato adecuado lo corregimos, pero ya tenemos nuestro fichero de datos. d. Guardamos nuestros datos con el nombre empresa.sta

NOTA:
El fichero empresa.xls, contiente la informacin referida a los trabajadores de una empresa dedicada a la venta que posee tres sucursales: en Bilbao, Logroo y Santander. En la tabla siguiente figuran los datos de las variables: nombre, antig (Aos de antigedad en la empresa), salario06 (Salario anual bruto, en , percibido en el ao 2006), sucursal, sexo, puesto, bajas (nmero de partes de baja presentados en el ao 2006) y adelantos (nmero de adelantos de nmina solicitados durante 2006)
nombre antig salario06 sucursal sexo puesto bajas adelantos

Garca Heras, Natalia Fernndez Rica, Luz Rico Gmez, Patricia Lpez Calvo, Sheila Prez Lacalle, Agustn Muoz Iglesias, Jess Martnez Fuentes, Pedro Prez Ganuza, Esteban Martnez Prez, frica Minus Lpez, Rosa Jimnez Ro, Lola Pascual Pava, Lourdes Lpez Gil, Amparo Gmez Rituerto, Rosario Lara Senz, Pedro Abad Herrera, Adrin Soto lvarez, Fernando Garca Garca, Rafael Jimnez Cruz, Benito Rojo Pardo, Eulalio

3 5 8 10 15 9 12 5 2 5 6 8 8 12 13 4 8 10 12 15

16300 18200 22600 23000 20100 39000 52000 35000 14900 24000 26200 27400 26600 30100 31600 27800 28600 29800 40900 34000

Santander Santander Bilbao Logroo Bilbao Santander Bilbao Logroo Santander Santander Bilbao Bilbao Logroo Logroo Logroo Santander Bilbao Bilbao Santander Bilbao

mujer mujer mujer mujer hombre hombre hombre hombre mujer mujer mujer mujer mujer mujer hombre hombre hombre hombre hombre hombre

Administrativo Administrativo Administrativo Administrativo Administrativo Directivo Directivo Directivo Comercial Comercial Comercial Comercial Comercial Comercial Comercial Comercial Comercial Comercial Comercial Comercial

2 2 6 4 6 3 2 2 3 3 4 5 3 1 2 2 5 2 2 2

2 5 3 4 3 1 4 4 4 4 4 3 0 3 2 4 4 1 4 2

En un fichero de estas caractersticas es conveniente codificar los valores de las variables: sucursal, sexo y puesto. Como puedes comprobar, el sistema lo ha hecho

Prcticas con STATISTICA

pgina 6

automticamente, pero tambin lo ha hecho con la variable nombre (en general lo hace con todas las variables que contienen texto). Cambia el formato de la variable nombre a formato texto de longitud 30. Vuelve a guardar el fichero. IMPORTANTE: este fichero se utilizar en las siguientes prcticas

Creacin de variables calculadas:


En algunas ocasiones, no slo tenemos que trabajar con los datos obtenidos en la observacin de una poblacin o una muestra, sino que nos interesa calcular nuevas variables como combinacin de las anteriores o con valores constantes que nos permitan completar nuestro estudio. Abre el fichero atletas.sta. Ejercicio 1: Supongamos, por ejemplo que queremos crear una variable que contenga, cunto se ha rebajado la marca desde los 10 segundos. Vamos a aadir una variable que calcule esta diferencia: a. Data/ Variable/Add... (o doble clic en la primera columna vaca) a. Cuntas variables: 1 b. Despus de: Nacionalidad c. Nombre: mejora d. Formato: nmero con 2 decimales e. Frmula: =10-marca

NOTA: Si hacemos clic en el botn Functions, veremos la lista completa de las funciones que tiene predefinidas este programa.

Ejercicio 2: Tambin podemos crear una variable con un valor concreto, por ejemplo el valor de PI: Podemos hacerlo como antes, o bien: a. doble clic en el nombre de cualquier variable

Prcticas con STATISTICA b. Clic en Todas las especificaciones c. Var/ Add Vars

pgina 7

d. 1 variable, despus de mejora

e. Ponemos el nombre y la Frmula de la nueva variable (10 decimales)

Aunque para obtener el valor de PI basta usar la funcin Pi, nos puede aparecer un mensaje de error (Pi puede ser el nombre de una variable):

Este mensaje lo que nos dice es que si queremos usar el contenido de la variable 6 escribamos V6 y si lo que queremos es usar la funcin Pi (predefinida)

escribamos @Pi: Guardamos el fichero de datos (basta con guardar si no queremos cambiarle el nombre). Abre el fichero empresa.sta (si es que lo has cerrado) Ejercicio 3: Sabiendo que los datos que tenemos de la empresa hacen referencia a 2006, crea una variable, llamada antig07, que contenga los aos de antigedad que tienen los empleados en 2007.

Prcticas con STATISTICA Creamos la nueva variable igual que antes. Ojo, tenemos que tener activo el fichero de datos en el que queremos aadirla, ya que si no nos fijamos, podemos aadirla, por ejemplo, a la ventana de resultados estadsticos (ya que tambin es una ventana de datos)

pgina 8

Ejercicio 4: Sabiendo que en 2007 el incremento de salario fue de un 4%, crea una nueva variable, de nombre salario07, que recoja el salario en 2007. Repetimos el procedimiento anterior (aadimos la variable a continuacin de las que ya existen) teniendo en cuenta que: salario07=1,04*salario06. Ejercicio 5: Crea una nueva variable, de nombre LN_salario06, que recoja logaritmo neperiano del salario en 2006.

Igual que los anteriores:

Otra forma de crear variables es recodificando los valores de una variable existente. Recodificar (Recode): sustituye los valores de la variable indicada por los valores codificados. Si no queremos perder la variable original, debemos duplicarla (crear otra con sus mismos valores) y aplicarle Recode a esta ltima. Ejercicio 6: Creamos una nueva variable llamada cdigos y en ella pondremos los valores codificados de la variable salario06:

Ojo!, slo admite condiciones sencillas, las expresiones complejas debemos simplificarlas.

No podemos escribir: 25000<=v3<=30000 porque eso son dos condiciones a la vez.

Guardamos el fichero de datos (basta con guardar si no queremos cambiarle el nombre).