Está en la página 1de 63

STATGRAPHICS

CENTURION XVI.I
Joeline Simone Monterrosa Barajas

2014-I
UIFCE
Universidad Nacional de Colombia
StatGraphics Centurion XVI.II

STATGRAPHICS CENTURION XVI.II


Joeline Simone Monterrosa Barajas1

Abril 2014

RESUMEN
StatGraphics es un Software estadístico de carácter privativo y uno de los más intuitivos para Windows.
StatGraphics Centurión XVI.II es la décimo sexta edición de StatGraphics para computadores; la primera
versión fue realizada en 1982. Este Software cuenta con una amplia gama de procedimientos
(alrededor de 180) para el desarrollo de análisis estadísticos profundos de datos. Estos procedimientos
abarcan desde resúmenes estadísticos hasta la elaboración de experimentos. Todas las funciones se
manejan a través de menús y adicionalmente StatGraphics cuenta con herramientas tales como
StatWizard y StatAdvisor que pueden ayudarle a hacer un uso más eficiente del programa.

En este documento, el lector encontrará una guía de uso del software StatGraphics que le permitirá
hacer uso de diversas herramientas ofrecidas por el programa. El presente manual cuenta con un
minucioso detalle de los pasos que el usuario debe seguir para ejecutar cada uno de los procesos
estadísticos y probabilísticos que aquí son mostrados.

Palabras clave: Estadística, probabilidad, estimación, regresión.

ABSTRACT
StatGraphics statistical software is proprietary in nature and one of the most intuitive for Windows.
StatGraphics Centurion XVI is the sixteenth edition of StatGraphics for computers; the first version was
made in 1982. This software has a wide range of procedures (about 180) for the development of deep
statistical analysis. These procedures range from statistical summaries to the preparation of
experiments. All functions are managed through menus; StatGraphics further features and tools such
as StatWizard and StatAdvisor that can help you make more efficient use of the program.

In this document, the reader will find a guide to using the StatGraphics software that will allow you to
use various tools offered by the program. This manual has a detailed breakdown of the steps that the
user must follow to execute each of the statistical and probabilistic processes are shown here.

Keywords: statistics, probability, estimation, regression.

1
Estudiante de Economía de la Facultad de Ciencias económicas de la Universidad Nacional de Colombia.
Monitor Junior del grupo Capacitaciones de la Unidad de Informática de la Facultad de Ciencias Económicas.
jsmonterrosab@unal.edu.co

1
StatGraphics Centurion XVI.II

Estudiantes Auxiliares:
Andrea Milena Novoa Ospina
Andrés Felipe Acevedo Trujillo
Angie Yamile Mayorga Coy
Camila Alejandra Romero Beltrán
Catalina Heredia Medina
Cindy Carolina Lugo Rozo
Daniel Andrés Roa Aponte
Daniel Fernando Eslava Ursuga
Director Unidad Informática: Daniel Felipe Leyva Díaz
Henry Martínez Sarmiento David Hernando Medina Cifuentes
Deisy Julieth Roa Riveros
Tutor Investigación: Diego Armando Poveda Zamora
Mario Andrés Rubiano Rojas Diego Fernando Ávila Ibáñez
Coordinadores: Edwar Leonardo Esteban Pérez
Andrés Felipe Hurtado Casas Fredy Esteban Ahumada Avendaño
Mario Andrés Rubiano Rojas Javier Santiago Rodríguez Cajamarca
Joeline Simone Monterrosa Barajas
Coordinador Servicios Web: Lasly Yulieth Vega Santamaría
John Jairo Vargas Sebastián Camilo Malpica Cárdenas
Sergio Enrique Pulido Morales
Analista de Infraestructura y Comunicaciones: Walter Daniel Parra Jiménez
Diego Alejandro Jiménez Arévalo Jeisson Daniel Mariño Ustacara
Néstor Santiago Castro Triviño
Analista de Sistemas de Información:
Diego Armando Poveda Zamora Este documento es resultado de un trabajo
conjunto y coordinado de los integrantes de la
Unidad de Informática y Comunicaciones de la
Facultad de Ciencias Económicas de la Universidad
Nacional de Colombia.

Esta obra está bajo una licencia reconocimiento no comercial 2.5 Colombia de
Creative Commons. Para ver una copia de esta licencia, visite
http://creativecommons.org/licenses/by/2.5/co/ o envié una carta a Creative
Commons, 171second street, suite 30 San Francisco, California 94105, USA.

2
StatGraphics Centurion XVI.II

Manual del usuario StatGraphics Centurión XVI.II

Introducción
A través del tiempo, el estudio de las ciencias estadísticas y su aplicación ha cobrado gran importancia
en el estudio de todo tipo de fenómenos, en especial, en fenómenos sociales. Disciplinas como la
econometría, se valen de un sinnúmero de herramientas estadísticas para abordar en forma analítica
los diversos retos que impone la economía como ciencia social. Es por ello, que el uso de herramientas
que permitan facilitar la ejecución de diversos procesos estadísticos, ha sido muy bien recibido por
parte de los académicos. En la actualidad se cuenta con una amplia variedad de Software estadísticos y
econométricos que se han convertido en grandes aliado de profesores, estudiantes e investigadores de
las ciencias económicas, es por tanto que surge la necesidad de revisar la utilidad de cada uno de estos
programas con el fin de sacar el mayor provecho posible reduciendo al máximo el tiempo destinado
procesamiento de datos.

StatGraphics es un software estadístico de carácter privativo, que posee una gran cantidad de procesos
completos para el procesamiento de datos, razón por la que se decide iniciar una investigación a
propósito de este programa, no solo para revisar la utilidad de estos procesos, sino también para
determinar la pertinencia de la implementación de este software en la Facultad de Ciencias
económicas de la Universidad Nacional de Colombia.

El presente documento cuenta con la descripción de diversos procedimientos probabilísticos y


estadísticos, explorados durante el periodo 2014-I sobre la versión XVI.II de StatGraphics Centurion.
Este manual cuenta con una breve guía de instalación del programa, así como una exploración
detallada de la interfaz del mismo. A continuación, se encuentran algunos procesos probabilísticos con
sus principales características y la explicación de las diversas herramientas que ofrece el programa para
ellos y un ejemplo práctico para ver su utilidad. Posteriormente, se hace una revisión de las
herramientas estadísticas básicas y finalmente se expone la forma de hacer regresiones lineales tanto
simples como múltiples. Para cada uno de los procesos, se plantea un ejemplo práctico con el fin de
afianzar la comprensión de tales procedimientos.

Objetivos
Objetivo general
Con la presente investigación se pretende elaborar un manual de trabajo del software StatGraphics,
que permita una amable introducción del usuario al programa y le brinde las herramientas necesarias
para el uso de sus principales herramientas estadísticas y probabilísticas.

Objetivos específicos
1. Explorar el entorno gráfico del software StatGraphics, reconociendo la utilidad y
funcionamiento de las funciones básicas del mismo.
2. Explorar las herramientas con las que cuenta el software StatGraphics para la introducción y el
manejo de datos.

3
StatGraphics Centurion XVI.II

3. Identificar las herramientas de representación de datos en gráficas, con las que cuenta el
programa StatGraphics.
4. Identificar y comprender las principales funciones para el análisis probabilístico con el que
cuenta el software StatGraphics.
5. Identificar y comprender las principales funciones para el análisis estadístico de datos con las
que cuenta StatGraphics.
6. Resaltar la aplicabilidad del software en algunas asignaturas de los programas de pregrado de
la Facultad de ciencias económicas.

Introducción a StatGraphics
Adquisición e instalación de StatGraphics Centurión
XVI.II
El paquete StatGraphics Centurion XVI.II se encuentra disponible para ordenadores con las siguientes
características:

 Sistema Operativo: Windows XP, Windows ME, Windows 2000, Windows Vista, Windows 7 y
Windows 8 en version de 32-bit y 64-bit.
 Procesador: Pentium 1 (mínimo).
 Memoria: 32
 Espacio libre en disco: 65 MB

Por ser un software privativo, es necesaria la adquisición de la licencia correspondiente. Para ello
puede acceder directamente a la página oficial de StatGraphics http://www.statgraphics.com, en la
que podrá encontrar las distintas versiones del software y escoger aquella que más se acople a sus
necesidades. Usted podrá descargar el setup del programa correspondiente al sistema operativo de su
computador y tendrá una versión de prueba que podrá explorar por los siguientes 30 días. Si el
programa resulta ser de su interés usted podrá comprar la licencia en la página web, siguiendo los
pasos que allí le sean indicados.

Acceso a StatGraphics
Después de instalar StatGraphics Centurión XVI en su computador, encontrará en el escritorio un icono
de acceso directo para ejecutar el programa.

Ingrese a StatGraphics haciendo doble clic sobre este acceso directo. La primera vez que ejecute el
programa, aparecerá la siguiente ventana de bienvenida:

4
StatGraphics Centurion XVI.II

Si usted tiene la versión de prueba del programa, seleccione la opción EVALUAR que encontrará en la
ventana emergente, esta aparecerá cada vez que ejecute el programa y le recordará el tiempo que
resta para que caduque la licencia temporal de prueba del programa.

Después de que usted haya comprado el programa, podrá seleccionar la opción ACTIVAR en la ventana
de Bienvenida para hacer la validación de su compra. En este caso, aparecerá la siguiente ventana

En esta deberá diligenciar los datos que le sean solicitados y al finalizar, hacer clic sobre la opción
Hecho. De esta forma, el programa estará listo para ser usado.

5
StatGraphics Centurion XVI.II

Entorno StatGraphics
Haga doble clic sobre el acceso directo y seleccione la opción correspondiente en la Ventana de
Bienvenida. El ejecutarse el programa, podrá apreciar el entorno gráfico de StatGraphics como sigue.

Si al ejecutar el programa emerge la ventana StatWizard mostrada a continuación,

Puede cerrar esta ventana mientras explora el programa y después volver a iniciarla cuando vaya a
empezar su trabajo. La explicación de la ventana StatWizard se dará a continuación.

Partes de la Ventana inicial


En la parte superior de la ventana ubique la Barra de Titulo; en ella encontrará el nombre del StatFolio,
que corresponde a la carpeta especifica creada por StatGraphics para el trabajo que esté realizando.
Debajo de la barra de título, se observa la Barra de Menú, en la que hay 14 listas desplegables con
diversas herramientas de edición y análisis. Debajo de la barra de menú esta la Barra de Herramientas,
la cual dispone de varios iconos que le permitirán ejecutar los procesos más usuales en forma rápida.

6
StatGraphics Centurion XVI.II

En la parte central de la ventana encontrará la hoja de datos de StatGraphics, en la que se almacenará


la información que se van a analizar.

En la parte inferior de la pantalla encontrará una serie de ventanas minimizadas

Descritas de izquierda a derecha, encontrará las siguientes ventanas:

 La ventana de comentarios: Está diseñada para hacer la descripción del StatFolio en que usted
este trabajando. Funciona de forma análoga a un bloc de notas, por tanto, no se podrá hacer
inserción de gráficas ni de otro tipo de objetos distintos al texto.
 La ventana StatReporter: En esta ventana es almacenan los comentarios y anotaciones del
usuario para su posterior edición. Esta ventana cuenta con las principales herramientas para la
elaboración de un texto, como opciones de alineación, uso de viñetas y numeración, fuente y
tamaño de letra entre otros.

En esta ventana también podrá copiar resultados obtenidos en la hoja de trabajo de


StatGraphics. Para hacerlo, seleccione la información que requiera y al hacer clic derecho

7
StatGraphics Centurion XVI.II

sobre la ventana correspondiente se desplegará un menú en el que podrá seleccionar la opción


Copiar análisis a StatReporter (Copiará tanto las gráficas como el texto de análisis), Copiar
ventana a StatReporter (copiará solo el texto de análisis) o simplemente Copiar (Copiará solo el
texto seleccionado). A continuación vaya a la ventana de StatReporter, haga clic derecho sobre
esta ventana y seleccione la opción pegar. Es importante resaltar que este es un texto estático,
por tanto, si se modifican los parámetros del análisis, los resultados contenidos en el
StatReporter no se modificarán.

 La ventana StatAdvisor: Esta ventana está diseñada para elaborar una primera interpretación
de los resultados de procedimientos desarrollados. Le explicará los resultados de las pruebas
estadísticas, le prevendrá de cualquier supuesto crítico que pudiera haber sido violado por los
datos, y le sugerirá otros procedimientos que podrían aplicarse. Puede accederse a esta
ventana en cualquier momento, pulsando el botón del StatAdvisor en la barra de herramientas
principal.

 La ventana StatGallery: Esta ventana permite almacenar los resultados gráficos del análisis
realizado. Inicialmente, la ventana StatGallery tendrá cuatro paneles organizados en forma
2X2, sin embargo usted podrá incluir más módulos en esta ventana e incluso insertar más
páginas en el StatGallery.

Para modificar la apariencia de la página principal del StatGallery, haga clic derecho sobre esta
ventana y seleccione la opción Organizar Ventanas. A continuación emergerá el siguiente
cuadro.

8
StatGraphics Centurion XVI.II

En esta ventana usted podrá elegir la apariencia del StatGallery, según el número de paneles
que desee agregar y la distribución que desee darles. Cada página del StatGallery puede
mostrar simultáneamente hasta nueve ventanas paneles de gráficos. Después de hacer su
elección, haga clic en el botón Aceptar.

Para agregar imágenes de la hoja de trabajo de StatGraphics en el StatGallery, vaya a la hoja de


trabajo donde tenga los resultados del análisis y haga clic derecho sobre la gráfica que desee
copiar (Ctrl+C). Posteriormente, seleccione la opción Copiar Ventana a StatGallery. A
continuación, abra la ventana StatGallery y haga clic derecho sobre el panel en que desee
poner la gráfica (Ctrl+V). Seleccione la opción Pegar y la gráfica que ha seleccionada aparecerá
añadido en la ventana seleccionada.

El usuario podrá acceder a cualquiera de las partes principales de la interfaz de StatGraphics desde el
menú que encontrará a la izquierda de la pantalla. En este módulo también podrá dirigirse
rápidamente a los procesos que haya realizado previamente, ya que se generará un icono por cada
procedimiento y una lista desplegable con los resultados obtenidos. Al hacer doble clic sobre ellos, se
abrirá la ventana correspondiente.

El conjunto previamente descrito, recibe el nombre de StatFolio y puede ser almacenado en su


computador, para realizar ediciones posteriores sobre el análisis realizado o los datos usados.

9
StatGraphics Centurion XVI.II

Guardar archivos de StatGraphics


El usuario podrá guardar los archivos que maneje en StatGraphics o todo el StatFolio en cualquier
memoria interna o externa su computador. Para guardar sus documentos, diríjase a la barra de menú,
haga clic sobre la opción Archivo y seleccione la opción Guardar Como. Allí encontrará la opción de
Guardar el StatFolio, Datos, StatGallery y StatReporter.

Seleccione la opción que desee y la ubicación en el que o pondrá. Finalmente seleccione el botón
Guardar.

Introducción de datos en StatGraphics.


Ventana StatWizard
La ventana StatWizard es el asistente de StatGraphics dentro de cualquier proceso que se desee
desarrollar. Esta ventana aparece al abrir el programa y podrá ir a ella cada vez que lo requiera
haciendo clic en el icono de acceso directo que encontrará en la barra de herramientas.

La ventana StatWizard tiene la siguiente apariencia y opciones:

10
StatGraphics Centurion XVI.II

1. Introducir nuevos datos importarlos de una fuente externa: En esta opción el usuario podrá
introducir los parámetros y variables que va manejará en su nuevo proyecto. Al dar clic en
aceptar, emergerá la siguiente ventana, desde donde podrá elegir la forma en que desea
ingresar los datos que van a ser objeto de análisis.

1.1. Al seleccionar la opción Deseo introducirlos con el teclado, aparecerán una serie de
ventanas que lo guiarán para la configuración de su tabla de datos, en la que deberá
especificar cada una de las variables con sus respectivas características.

La introducción manual de datos también podrá hacerla directamente sobre la hoja de


datos de StatWizard.

11
StatGraphics Centurion XVI.II

Al hacer doble clic sobre el encabezado de cada una de las columnas, aparecerá el cuadro
Modificar Columna mostrado previamente, donde podrá caracterizar los datos de cada
columna.

Es importante definir adecuadamente la tipología de los datos para que se pueda hacer el
análisis pretendido con cada uno de ellos. Los tipos se clasifican de la siguiente manera:

Tipo Descripción
Numérico Cadena numérica
Carácter Cadena Alfanumérica
Entero Números enteros
Fecha Mes, día, año
Mes Mes, año
Trimestre Trimestre, año
Hora (HH:mm) Horas y minutos
Hora (HH:mm:ss) Horas minutos y segundos
Fecha-Hora (HH:mm) Fecha y hora
Fecha-Hora (HH:mm:ss) Fecha y hora
Decimal Número fijo de decimales
Fórmula Funciones lógicas

1.2. La opción En un archivo de datos existente, una base de datos o en el portapapeles de


Windows, le permitirá importar archivos almacenados en su computador. Al seleccionar
esta opción, emergerá la siguiente ventana:

12
StatGraphics Centurion XVI.II

En esta ventana podrá seleccionar la cantidad de hojas en las que va a almacenar la


información. Esto lo puede hacer eligiendo la cantidad que desee en la opción Número de
hojas activas. A continuación podrá asignarle nombre a cada una de estas hojas en la caja
Nombre de la hoja y decidir si desea que tal hoja sea Solo de lectura, o si permitirá hacer
nuevos registros o modificaciones sobre la información que esta contenga. En la parte inferior
de la ventana encontrará las siguientes opciones:

 Abrir: Al seleccionar cualquiera de las hojas y hacer clic en el botón Abrir, saldrá
en pantalla una nueva ventana que le permitirá seleccionar el tipo de archivo en el
que tiene almacenados los datos que pretende cargar en el programa.
 Cerrar: esta opción le permitirá eliminar los datos que tenga en la hoja
seleccionada.
 Actualizar: Esta opción le permitirá guardar los cambios que le haya hecho a la
hoja de datos que tenga seleccionada.
 Guardar como: Esta opción le permitirá guardar los datos que tenga en la hoja
seleccionada como documentos de tipo .sgd, .sf6, (propios de StatGrafics) .sgm,
.sf3, .txt, .csv, .xml, .xlsx y .xls. Al seleccionar esta opción, se abrirá la ventana
habitual para guardar documentos, en donde debe seleccionar el nombre del
archivo, la ubicación y el tipo, para posteriormente usarlo en este u otros
software.
 Mostrar XML: Al seleccionar este botón, aparecerá una ventana con la ubicación
de la base de datos que tenga seleccionada.

Para ingresar los datos:

 Seleccione la hoja en la que los desea incluir.


 Haga clic en el botón abrir. Al hacerlo, aparecerá este cuadro:

13
StatGraphics Centurion XVI.II

Si selecciona la opción Archivos de datos StatGraphics, solo deberá seleccionar la ruta


en la que esta esté almacenada y automáticamente se cargará en la hoja de datos que
haya seleccionado.
Si selecciona la opción Datos de Archivo externo, emergerá el siguiente cuadro.

En este usted podrá seleccionar el tipo de documento que desea cargar en la hoja de
datos. En el cuadro Nombre del archivo, deberá escribir la ruta del documento que
desea cargar o seleccionarlo haciendo clic en el botón NAVEGAR. Posteriormente
podrá especificar las características del documento que ha seleccionado en los menús
que encuentra en la parte inferior del cuadro. Finalmente haga clic en el botón OK.
Si selecciona la opción Búsqueda ODBC o Consulta SQL Manual podrá seleccionar
bases de datos de tipo ODBC en la siguiente ventana.

Al hacer esto, aparecerán los datos en la hoja de datos de StatGraphics.

14
StatGraphics Centurion XVI.II

1.3. Con la opción En una fuente de datos asociada con StatFolio, usted podrá invocar otros
StatFolios o proyectos que estén almacenados en su computador. En términos prácticos,
esta opción le permite abrir un Proyecto que usted haya iniciado antes, para poder
continuar trabajando sobre él.
Al seleccionar esta opción, emergerá la ventana de búsqueda de Windows, en la carpeta
donde estén contenios todos los StatFolios previamente elaborados.

Solo deberá seleccionar el documento que necesite y hacer clic en el botón Abrir.
Automáticamente, se cargará el StatFolio con todas las hojas de Datos que hayan sido
creados en este.
1.4. En la opción Cargados en la hoja de datos de StatGraphics el usuario podrá caracterizar
datos que haya escrito previamente sobre la hoja de datos. Esta opción se activará
inmediatamente después de que usted haya introducido datos de cualquiera de las formas
previamente mencionadas, pues los datos que se encuentren en la hoja de Datos, serán los
que el Software use para los análisis que le sean requeridos.

Cuando haya ingresado todos los datos en las diferentes hojas de datos de StatGraphics, haga
clic en el botón Aceptar de la ventana Propiedades del libro de datos.

A continuación, saldrá el siguiente anuncio:

15
StatGraphics Centurion XVI.II

Al hacer clic en el botón Aceptar, podrá iniciar el análisis de datos que requiera sobre los datos
que ya han quedado almacenados en el proyecto.

2. Diseñar un nuevo experimento, estudio de Calibradores, gráfico de control o plan de


muestreo: Al seleccionar esta opción, aparecerá el siguiente menú.

3. Realizar un análisis que no requiere datos: Al seleccionar esta opción aparecerá el siguiente
menú:

En este menú el usuario encontrará un conjunto de opciones que podrá seleccionar en el


botón que está a la derecha de cada una y posteriormente haciendo clic en Aceptar. El
programa lo guiará en la ejecución de cada una de estas tareas, con una serie de instrucciones
y menús que emergerán en cuanto usted seleccione una de las opciones.

16
StatGraphics Centurion XVI.II

Análisis de datos en StatGraphics


Selección del tipo de análisis.
Para iniciar la selección del tipo de análisis, diríjase al icono del StatWizard y haga clic sobre él. Se
abrirá nuevamente el StatWizard con nuevas opciones, que le permitirán definir el tipo de análisis que
se pretende hacer. El usuario podrá seleccionar solo un tipo de análisis a la vez.

Los tipos de análisis están organizados en paneles de la siguiente manera:

1. Seleccionar análisis Basado en tipo de datos: El usuario podrá seleccionar esta opción,
haciendo clic sobre el botón que encontrará a la izquierda de la opción y haciendo clic
posteriormente en el botón Aceptar. A continuación, encontrará un menú en el que podrá
asignar a cada variable, las características que tendrán en el tipo de análisis que va a realizar.

Para clasificar las variables que va a utilizar como parámetros dentro del análisis. El nombre de
todas las columnas que usted ha introducido en la hoja de datos, aparecerá a la derecha del
cuadro de Selección de datos. Para definirlas como parámetro, seleccioné la variable haciendo
clic sobre ella y a continuación haciendo clic sobre el botón de la caja correspondiente la
categoría en la que la usará.

17
StatGraphics Centurion XVI.II

Después de haber parametrizado las variables que manejará, haga clic en Aceptar. De esta
forma emergerá el siguiente cuadro.

En esta ventana, el usuario podrá definir el rango de filas y columnas de datos de las variables
seleccionadas para especificar si desea trabajar con algunos de esos datos o con todos. Si
desea trabajar con todos los datos existentes en las columnas de las variables seleccionadas,
puede definir el rango rápidamente, haciendo clic sobre el botón titulado “Todas las filas”; de
lo contrario, encontrará los espacios correspondientes para especificar los datos que desea
usar en el análisis. Después de haber hecho la respectiva selección, haga clic en Aceptar. El
Software le preguntará por medio del siguiente cuadro si desea cambiar alguna de las
variables, para atribuirles alguna característica deseable a las mismas.

18
StatGraphics Centurion XVI.II

 Si en esta ventana su selección es Si, emergerá el siguiente cuadro:

Este cuadro le irá mostrando cada una de las variables, iniciando por aquellas que hayan sido
ubicadas en la caja Datos o Variables de respuesta de la ventana de Selección de datos,
asígnele los atributos que desee y luego haga clic en Aceptar. Inmediatamente después de
hacer esto, aparecerá la misma ventana con las variables que hayan sido incluidas en la
segunda categoría del cuadro de selección de datos. Siga el mismo procedimiento hasta que
haya hecho el ajuste a cada una de las variables que ha considerado para su análisis. Asegúrese
de revisar todas las variables que haya incluido en cada una de las cajas del cuadro Selección de
datos, haciendo clic en la flecha que encontrará junto al nombre de cada variable que
aparezca.

Al terminar la modificación de los valores, podrá continuar con el análisis tal como si su selección
anterior hubiese sido No.

 Si su selección es No, aparecerá el cuadro Selección de análisis, en el que podrá iniciar con el
análisis a los datos, seleccionando las opciones que requiera.

19
StatGraphics Centurion XVI.II

Al hacer clic en Aceptar, el programa le confirmará la cantidad de ventanas que abrirá.

A continuación se abrirán las ventanas indicadas y se ejecutará el análisis requerido.

2. Seleccionar análisis por nombre: Al seleccionar esta opción, el usuario tendrá un amplio menú
de opciones de análisis. Al seleccionar cualquiera de ellos, emergerán una serie de ventanas
que lo guiaran en la selección de las variables y en la ejecución de los procedimientos.

3. Seleccionar un SnapStat: Un SnapStat es un análisis sencillo sobre un conjunto de datos


contenidos en la hoja de Datos de StatGraphics, que generan una sola hoja con un estructura
prediseñada con el resultado de todo el análisis ejecutado.

20
StatGraphics Centurion XVI.II

Distribuciones de Probabilidad con StatGraphics

StatGraphics ofrece la posibilidad de usar diversas distribuciones de probabilidad. Para acceder a ellas,
haga clic sobre la opción Plot que se encuentra en la barra de menús. A continuación, se desplegará un
menú en el que aparece la opción Distribuciones de probabilidad.

Al hacer clic sobre esta opción, emergerá una ventana que posee un listado con todas las distribuciones
de probabilidad (45 distribuciones distintas) con que cuenta StatGhraphics. Para seleccionar un tipo de
distribución en particular, basta con hacer clic derecho en el botón que encontrará a la izquierda de las
opciones y finalmente dar clic en el botón OK.

21
StatGraphics Centurion XVI.II

Hecho esto, se abrirá automáticamente la ventana de Distribuciones de probabilidad (Probability


Distributions) en el que encontrará información de la distribución normalizada. Esta nueva ventana
cuenta con cuatro paneles, en los que se muestra la descripción y gráfica tanto de la función de
probabilidad como de la función de distribución acumulativa.

Modificación de distribuciones
El usuario podrá modificar los parámetros de esta distribución para que se adapten al análisis que esté
llevando a cabo. Para ello, haga clic derecho sobre esta ventana y seleccione la opción Analysis options
que encontrará en el menú desplegable.

De este modo, aparecerá en pantalla el cuadro en el que podrá digitar los parámetros de su análisis, así
como generar simultáneamente hasta 5 distribuciones del mismo tipo con los parámetros que se
desee.

22
StatGraphics Centurion XVI.II

Al hacer clic en el botón OK para guardar dichos cambios. StatGraphics hará inmediatamente la
modificación de la gráfica inicialmente mostrada y mostrará simultáneamente en los mismos cuadros el
análisis de las diferentes distribuciones que el usuario haya generado en el cuadro anterior.

StatGraphics también permite calcular el valor de la función de distribución acumulativa para varios
valores. Para esto, haga clic derecho sobre el panel de la función de distribución acumulativa
(Cumulative Distribution) y en el menú que se desplegará dé clic sobre la opción Pane Options.

A continuación, emergerá un cuadro en el que puede escribir varios valores de la variable aleatoria o
cuantiles de los que desea calcular la probabilidad.

23
StatGraphics Centurion XVI.II

El programa calculará el valor de la función de densidad o masa de probabilidad para el valor que ha
introducido, así como el área de las colas inferiores y colas superiores a los valores dados, es decir, la
probabilidad acumulada hasta el valor dado y para los valores posteriores a este, respectivamente. Los
resultados se mostrarán en el panel de distribución acumulativa de la siguiente forma:

En caso de que el usuario desee hacerle modificación o incluir especificaciones en las gráficas, podrá
hacerlo haciendo clic derecho sobre la gráfica que desee modificar y seleccionando posteriormente la
opción Graphics Options.

Al hacer esta selección, emergerá el siguiente cuadro en el que podrá modificar la grilla, el color, el
nombre de los ejes, el nombre de la gráfica y la escala de los ejes entre otros cambios. Después de
haber hecho las modificaciones, haga clic en el botón Aplicar (opción que se activará con el primer
cambio que se haga) y podrá apreciar la gráfica con los cambios requeridos.

24
StatGraphics Centurion XVI.II

Adicionalmente, al hacer doble clic sobre una gráfica, esta se desplegará sobre todo el cuadro y le
permitirá analizar más detalladamente la gráfica. Por ejemplo, al hacer clic derecho sobre esta,
encontrará la opción Locate que posiciona un par de ejes sobre la gráfica, y muestra detalladamente las
coordenadas de cada punto, por ejemplo si el usuario requiriera ver el punto exacto donde las gráficas
se comportan de alguna forma específica.

25
StatGraphics Centurion XVI.II

También encontrará la opción Reset Scaling/Viewpoint que le permite reestablecer el tamaño original
de las gráficas si se le ha hecho alguna modificación previamente. Adicionalmente encontrará las
opciones básicas de copiar y guardar la gráfica.

Cabe aclarar que aunque las imágenes mostradas se refieren a la Distribución normal, tomada por ser
la más usada, el manejo de otras distribuciones de probabilidad continuas y de las distribuciones de
probabilidad discretas es análogo en este software

Adicionalmente, el usuario podrá agregar notas sobre las gráficas generadas por StatGraphics,
haciendo clic en el siguiente botón.

Este botón lo encontrará en la barra de Herramientas de análisis. Al hacer clic en este botón, emergerá
la siguiente ventana.

En ella usted podrá escribir cualquier descripción o comentario y escoger la orientación que quiera
para este. En el botón Fonts encontrará diferentes opciones para el texto que desea escribir como
estilos de fuente, colores y tamaños para el texto. Al hacer clic en el botón OK su texto aparecerá sobre
la gráfica y usted podrá ubicarlo en cualquier posición del cuadro de gráfica.

Al hacer clic derecho sobre cualquiera de los paneles, encontrará las distintas instancias donde podrá
guardar los resultados de su análisis.

Opciones adicionales en Distribuciones de probabilidad.


Además del análisis y las gráficas mostradas previamente, StatGraphics ofrece algunas opciones que
aunque menos utilizadas, también pueden resultar muy útiles. Las opciones adicionales, así como las
vistas anteriormente para distribuciones de probabilidad, las encontrará en la barra superior del
StatFolio como iconos de acceso directo en la barra denominada Barra de herramientas de análisis.

1. En el primer icono (de derecha a izquierda) podrá acceder a la lista de opciones de


distribuciones de probabilidad que se ha descrito previamente.

26
StatGraphics Centurion XVI.II

2. Al hacer clic en el segundo icono, emergerá el siguiente cuadro en el que podrá elegir las tablas
que puede incluir en el cuadro Probability Distributions.

Las dos primeras opciones que probablemente ya están seleccionadas, hacen referencia al
análisis de la función de distribución de probabilidad (Analysis Summary) y la función de
distribución acumulativa respectivamente (Cumulative distribution).

La siguiente opción Inverse CDF encuentra los valores críticos para la distribución que se esté
trabajando. El valor crítico se define como el valor más grande para la distribución de manera
que la probabilidad no exceda el área especificada.

La última opción Random Numbers, genera números aleatorios desde la distribución


seleccionada. Para hacer la generación de tales números aleatorios, se debe hacer clic sobre el
tercer icono (guardar) en la barra de herramientas de análisis. Al hacer clic allí, emergerá la
siguiente ventana en la que podrá elegir con respecto a cuál o cuáles distribuciones generará
los números aleatorios y como se identificarán estos.

27
StatGraphics Centurion XVI.II

En el panel Datasheet de la ventana mostrada previamente, el usuario puede escoger la


página de la hoja de datos en la que almacenará tales números.

3. Regresando a los iconos de la barra de herramientas de Análisis, la tercera opción genera el


siguiente cuadro, en el que podrá elegir las gráficas que desea que aparezcan en los paneles de
la ventana de distribuciones de probabilidad.

Las dos primeras opciones que generalmente ya están seleccionadas, representan las gráficas
de función de masa o función de probabilidad, según sea una variable discreta o continua
(Density/Mass Function), y la Función de distribución acumulada (CDF).

La siguiente función es la función de supervivencia o Función de fiabilidad (Survival


Probability). Esta función estadísticamente, es el complemento de la función de distribución de
probabilidad y se puede interpretar de diversas maneras, según el campo en el que se esté
haciendo el análisis. La siguiente función, es la función Logarítmica de fiabilidad que
representa un ajuste de la función de fiabilidad por medio de la aplicación del logaritmo.
Finalmente, se encuentra la función de Riesgo (Hazard Function) que es la relación entre la
función de densidad de probabilidad o masa de probabilidad y la función de supervivencia.

4. Al hacer clic sobre el quinto icono, emergerá el cuadró en el que se pueden modificar los
parámetros de las distribuciones, explicados previamente.

Ejemplo de Distribuciones de Probabilidad.


El número medio de automóviles que llega a una estación de suministro de gasolina es de 210 por
hora. Si dicha estación puede atender a un máximo de 10 automóviles por minutos, determinar la
probabilidad de que en un minuto dado lleguen a la estación de suministro más automóviles de los
puede atender.

El número de automóviles que llegan a la estación de servicio en un minuto puede representarse por
una variable de Poisson de parámetro ⁄ llegadas por minuto. La probabilidad que
hay que calcular es ya que para que lleguen a la estación más automóviles por minuto de
los que se puedan atender es necesario que lleguen más de 10 por minuto.
Para calcular esta probabilidad, acceda al menú Describe, seleccione la opción Distribution Fitting y en
el menú desplegable, elija la opción Probability Distributions.

28
StatGraphics Centurion XVI.II

En la tabla de distribuciones de probabilidad, seleccione la opción Poisson y a continuación haga clic en


OK. Haga clic derecho sobre la ventana Probability Distributions y seleccione la opción Analysis Options
en el menú desplegable que se haya generado.

En la ventana Options Poisson, introduzca el valor de la media, que en este caso es 3,5 y haga clic en
OK.

El cuadro Probability Distributions le mostrará la distribución Poisson con media 3,5. Para Calcular la
probabilidad de que la variable aleatoria tome un valor menor que 10, haga clic derecho sobre el panel
Cumulative Distribution y a continuación seleccione la opción Pane Options.

En la ventana que se genera elija el valor de la variable aleatoria, este caso 10, y haga clic en OK.

29
StatGraphics Centurion XVI.II

En el mismo panel de la Distribución Cumulativa, encontrará los siguientes resultados.

Los resultados obtenidos en este cuadro indica que la probabilidad de obtener un valor de menos de
10,0 es 0,996685. Además, la probabilidad de obtener un valor mayor que 10,0 es 0,00101939. La
probabilidad de obtener un valor exactamente igual a 10,0 es 0,00229555.

Análisis de Datos.
Representación de variables discretas
Uno de los procesos estadísticos más sencillos es la representación gráfica variables discretas que
representan a una característica de cierta población. Para realizar un procedimiento de este tipo en
StatGraphics, Puede acceder al menú Describe, seleccionar la opción Categorical Data y dar clic sobre la
opción Tabulation que ofrece este menú.

Ejemplo de representación de variables.


Se toma una muestra de la población y a cada individuo se le pregunta su nivel de escolaridad. Las
categorías de escolaridad son Primaria (1), Secundaria (2), Universitario (3), Posgrado (4) y Doctorado
(5). Se desea analizar la frecuencia de estos estados y hacer una representación gráfica de la misma.

30
StatGraphics Centurion XVI.II

Inicialmente, se introducirán los datos desde un archivo .csv como se indicó en la sección Introducción
de datos en StatGraphics. Los datos se pueden insertar bien sea como datos numéricos o como
caracteres.

Una vez insertados los datos, se selecciona la opción Tabulation como se indicó previamente y en el
cuadro de dialogo emergente, seleccione la variable que va a analizar.

Despues de hacer su selección haga clic en OK y obtendrá los resultados del análisis en el cuadro
Tabulation.

El panel superior izquierdo, indica la cantidad de datos que fueron considerados, así como la cantidad
de categorías en que se dividió la muestra. El panel inferior izquierdo, muestra la tabla de frecuencias,

31
StatGraphics Centurion XVI.II

tales como la Frecuencia relativa, la frecuencia cumulativa y la frecuencia cumulativa relativa. Los
paneles de la derecha muestran en diagrama de barras de frecuencia y el gráfico de disco
respectivamente.

Los resultados arrojados evidencian que las personas con Doctorado conforman la porción más
pequeña de la muestra, mientras que la mayoría de los individuos de la muestra tienen como máximo
grado de escolaridad, Secundaria.

Para modificar la presentación de los gráficos, haga doble clic sobre él y a continuación haga clic
derecho y seleccione la opción Pane Options. Esta generará la siguiente ventana, en la que podrá hacer
diversas modificaciones a la gráfica, como por ejemplo, agregar títulos, cambiar colores, nombrar ejes,
etc.

Análisis de una Muestra Simple


El muestreo simple es el procedimiento probabilístico de selección de muestras más sencillo y
conocido, sin embargo, en la práctica es difícil de realizar debido a que requiere de un marco muestral
y en muchos casos no es posible obtenerlo. Puede ser útil cuando las poblaciones son pequeñas y por
lo tanto, se cuenta con listados. Se utiliza ampliamente en los estudios experimentales, además, de ser
un procedimiento básico como componente de métodos más complejos (Antioquia, 2014).

Para iniciar el análisis de una muestra simple, haga clic en el botón Describe que encontrará en la Barra
de Menú, a continuación seleccione la opción Numeric Data y posteriormente One-Variable Analysis.

Al hacer la selección indicada, emergerá la siguiente ventana.

En esta ventana, seleccione la variable que desea analizar. En esta ventana encontrará el botón
Transform, que le dará la posibilidad de hacer diferentes transformaciones funcionales con la variable
seleccionada. Dicha transformación podrá hacerla por medio del siguiente cuadro de dialogo.

32
StatGraphics Centurion XVI.II

Después de hacer la transformación o si dese dejar la variable sin modificarla, haga clic en el botón OK.
A continuación, obtendrá los resultados en el cuadro titulado One-Variable Analysis que se muestra a
continuación.

Siempre que este activa esta ventana, estarán habilitados los botones de la Barra de Herramientas de
Análisis, los cuales le permitirán modificar la presentación de los resultados obtenidos.

La opción le permitirá reiniciar el análisis cambiando la variable objetivo.

La opción le permitirá elegir los cuadros de análisis que desea que se muestren en los paneles de
One-Variable Analysis. Al hacer clic en este botón, aparecerá la siguiente lista.

33
StatGraphics Centurion XVI.II

En esta ventana podrá seleccionar los resultados que sean de su interés, Entre las opciones se
encuentra:

 Analysis Summary: Esta opción mostrará el resumen de los datos de la muestra simple.
 Summary Statistics: Esta opción presentará en una tabla el resumen de los estadísticos para la
variable analizada, como medidas de tendencia central, medidas de variabilidad y medidas de
interés como la oblicuidad estandarizada y la curtosis estandarizada.
 Frequency Tabulation: Esta opción elabora una tabla de frecuencias dividiendo el rango de la
variable analizada en intervalos de igual longitud y contando el número intevalar. Las
frecuencias muestran el número de datos evaluados en cada intervalo y la frecuencia relativa
muestra la proporción en cada intervalo. Para modificar las características de los intervalos,
haga clic derecho sobre el panel y seleccione la opción Pane Options.

En esta opción puede seleccionar tanto la cantidad de intervalos, como los límites en que
evaluará la variable.

 Percentiles: Esta opción muestra los percentiles de la variable que se está analizando. Los
percentiles son valores por debajo del cual se encuentran los porcentajes específicos de los
datos.
 Stem-and-Left-Display: Muestra la tabulación de frecuencias de la variable analizada. El rango
de los datos ha sido dividida en 8 intervalos cada uno representado por una fila de la tabla. Los
tallos están etiquetados utilizando uno o más dígitos iniciales para los valores de los datos caen
dentro de ese intervalo. En cada fila, los valores de datos individuales están representados por
un dígito (llamado una hoja) a la derecha de la línea vertical. Al hacer clic sobre el panel y
seleccionar la opción Pane Options encontrará el siguiente cuadro.

Si desactiva la opción Flag Outliers en el panel se mostrarán el rango de los datos dividido en
12 intervalos, cada uno representado por una fila en la tabla.
 Confidence intervals: Este panel muestra los intervalos de confianza para la media y la
desviación estándar de la variable objetivo. Por defecto estos intervalos se dan con una
confiabilidad del 95%, sin embargo estos parámetros pueden ser modificados. Para hacerlo,

34
StatGraphics Centurion XVI.II

haga clic derecho sobre el panel y seleccione la opción Pane Options. Esta selección abrirá el
siguiente cuadro.

En este podrá modificar la confiabilidad del intervalo y el tipo de intervalo que desea obtener.
Después de hacer su elección, seleccione el botón OK. Los resultados los encontrará en el
panel

 Hypothesis Test: En este panel se muestran inicialmente los valores de la media, median y
desviación estándar de los datos. A continuación, se encuentran los resultados de las pruebas
relativas a la población de la que procede la muestra analizada. Las pruebas de hipótesis que
realiza StatGraphics son: Prueba t, Prueba de signos, Prueba de rangos con signo y prueba Chi.
Cuadrado. Los parámetros de estas pruebas se pueden modificar haciendo clic derecho sobre
el panel de pruebas de hipótesis y seleccionando la opción Pane options. Esta selección
generará la siguiente ventana.

Haga todas las modificaciones que considere pertinentes para su análisis y haga clic en el
botón OK para guardar los cambios.

El botón le mostrará un menú en el que podrá escoger las gráficas que desea visualizar en el
cuadro One-Variable Analysis.

35
StatGraphics Centurion XVI.II

Las gráficas disponibles son las siguientes: Gráfico de dispersión, gráfico de caja y bigotes, histograma
de frecuencias, gráfico de cantiles, gráfica de probabilidad normal, grafica de rastro de densidad y
gráfico de simetría. Seleccione las gráficas que desea incluir y haga clic en el botón OK para completar
su selección. Para analizar detalladamente las gráficas generadas, basta con que haga doble clic sobre
la gráfica de su interés y a continuación esta se ampliara sobre toda la ventana de análisis. Para hacerle
modificaciones, haga clic derecho sobre la gráfica y seleccione la opción Graphics Options.

En esta ventana podrá hacer todas las modificaciones concernientes a la presentación de la gráfica.

Si selecciona el menú desplegable la opción Pane Options emergerá el un cuadro en el que podrá
hacerle modificaciones al panel de la gráfica en general. Esta opción no se activa para todas las gráficas,
y el contenido del cuadro de dialogo que se genera depende del tipo de gráfica sobre el que desee
efectuar los cambios.

Para regresar a la vista de todos los resultados, basta con hacer doble clic sobre la gráfica.

36
StatGraphics Centurion XVI.II

Todos los resultados obtenidos a lo largo de este procedimiento pueden ser guardados en varias
instancias. Las opciones las encontrará haciendo clic derecho sobre el resultado que desee guardar. Al
hacer esto, encontrará varia opciones de almacenamiento, a las que podrá exportar tales resultados.

Ejemplo de análisis de una muestra simple.


Consideremos una población de 288 individuos, de los que se ha registrado su peso, estatura y género.
Se desea hacer un análisis descriptivo completo de las variables estatura (cm) y peso (Kg) para el
conjunto de observaciones y a partir de este análisis se pretende determinar cuál de las dos variables
numéricas es más homogéneas. Finalmente, se hará el mismo análisis descriptivo para esta población
clasificada por género y se contrastarán los resultados obtenidos en cada grupo.

En este caso se insertarán los datos desde el DataBook, como se indicó en la sección Introducción de
datos en StatGraphics. Se debe asignar a las variables Peso y Estatura el tipo Numeric y a la variable
Género el tipo Character, para evitar inconvenientes a la hora de manipular los datos. A continuación
se muestran los datos ingresados manualmente.

Para iniciar el análisis, haga clic en el menú Describe. En el menú desplegable, seleccione la opción
Numeric Data y a continuación One-Dimensional Analysis.

VARIABLE PESO

En el cuadro de dialogo, seleccione la variable que analizará inicialmente. Para este ejemplo
empezaremos con el análisis de la variable Peso; después de seleccionar la variable, haga clic en el
botón Ok.

37
StatGraphics Centurion XVI.II

La ventana One-Variable Analysis-PESO le mostrará los resultados de este primer proceso.

El resumen estadístico de la variable PESO, muestra el siguiente cuadro.

En este se muestra la cantidad de datos analizados, el peso promedio de la población, la desviación


estándar, coeficiente de variación, el mínimo, el máximo, el alcance, asimetría estándar y curtosis
estándar. Si desea ver más características de la variable PESO en el resumen estadístico, haga clic
derecho en el panel y seleccione la opción Pane Options.

38
StatGraphics Centurion XVI.II

Después de seleccionar las opciones de su interés haga clic sobre el botón OK y obtendrá los resultados
en la tabla mostrada en el cuadro de resumen Summary Statistics.

Para este ejemplo se encuentran los siguientes datos de interés: El total de datos analizados fue 288, el
peso promedio de la población fue de 64,27 kg, la mitad de la población pesa más de 64,21 kg, no hay
un dato modal ya que todo los datos son diferentes, el menor peso encontrado en la población es
56,99 Kg y el máximo es 71,04kg. El coeficiente de asimetría es 0,5720 e indica que la distribución para
esta variable tiene una leve asimetría hacia la derecha. El coeficiente de curtosis -1,187 corresponde a
una distribución platicurtica, es decir, con una reducida concentración alrededor de los valores
centrales de la distribución.

En la tabla Frecuency of Tabulation verá la tabulación de frecuencias de la variable peso, la cual se ha


obtenido dividiendo el eje de la variable peso en intervalos de iguale longitud y contando la cantidad
de datos observados que caen e ellos. La cantidad de intervalos y el rango de los mismos, lo puede
modificar haciendo clic derecho sobre el panel y seleccionando la opción Pane Options. La
representación gráfica de estos resultados, esta resumida en el histograma de frecuencias mostrado a
continuación:

La tabla de percentiles muestra algunos percentiles de muestra para la variable peso. Un percentil de
orden n indica el valor por debajo del cual está el n% de los datos observados. Estos percentiles son
representados en la gráfica Quantile Plot mostrada a continuación:

Estos percentiles se pueden modificar haciendo clic derecho sobre el panel y seleccionando la opción
Pane Options.

39
StatGraphics Centurion XVI.II

En el panel Stem-and-Leaf Display, se muestra una tabulación para la variable peso el rango de los
datos se muestra dividido en ocho partes representadas en las filas de la tabla. Los tallos están
etiquetados utilizando uno o más dígitos iniciales para los valores de los datos caen dentro de ese
intervalo. En cada fila, los valores de datos individuales están representados por un dígito (llamado una
hoja) a la derecha de la línea vertical. Los resultados de este panel se resumen en la gráfica de cajas y
bigotes mostrada a continuación.

VARIABLE ESTATURA

El análisis hecho previamente se repetirá para la variable estatura. El procedimiento es el mismo, por lo
que revisaremos solo los resultados. El total de datos analizados, al igual que en para la variable peso,
fue 288; la estatura promedio de la población es de 149.927 cm; La estatura de la mitad de la población
está por encima de 154,115 cm y la estatura más frecuente es 154,115 cm. El sujeto con menor
estatura mide 95,48 cm y la de mayor estatura es 199,48 cm. El coeficiente de asimetría es -2,41192, lo
cual indica que la distribución para esta variable tiene asimetría considerable hacia la izquierda. El
coeficiente de curtosis -1,85335 corresponde a una distribución platicúrtica, es decir, con una reducida
concentración alrededor de los valores centrales de la distribución.

En la tabla Frecuency of Tabulation verá la tabulación de frecuencias de la variable peso, la cual se ha


obtenido dividiendo el eje de la variable peso en intervalos de iguale longitud y contando la cantidad
de datos observados que caen e ellos. La cantidad de intervalos y el rango de los mismos, lo puede
modificar haciendo clic derecho sobre el panel y seleccionando la opción Pane Options. La
representación gráfica de estos resultados, esta resumida en el histograma de frecuencias mostrado a
continuación:

40
StatGraphics Centurion XVI.II

La representación de la tabla de percentiles es la siguiente.

Y el gráfico de caja y bigotes es como sigue:

HOMOGENEIDAD DE UNA VARIABLE.

La homogeneidad de las variables se puede determinar a partir del coeficiente de variación de cada
una. El coeficiente de variación expresa la desviación estándar como porcentaje de la media aritmética,
mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o

41
StatGraphics Centurion XVI.II

estándar. En este caso, el coeficiente de variación ha sido presentado en el cuadro de resumen


estadístico tanto para la variable peso como para la variable estatura. Los valores obtenidos fueron:

Coeficiente de variación PESO: 4,24543%

Coeficiente de variación ALTURA: 15,3459%

De este modo la variable Peso es más homogénea, por tanto, sus valores se encuentran más
concentrados en torno al valor medio de la variable.

ANÁLISIS ESTADÍSTICO DESCRIPTIVO POR GÉNERO

Para realizar un análisis sobre un subgrupo de los datos, se debe acceder a la opción Describe en la
Barra de Menú. En el menú desplegable seleccione la opción Numeric Data y a continuación, la opción
Subset Analysis.

En el siguiente cuadro de dialogo se introduce la variable que se va a analizar en la caja titulada Data,
en este caso primero revisamos la variable PESO. En la caja titulada codes inserte la variable según la
cual ha clasificado los datos de la muestra, en este caso GENERO. Finalmente haga clic sobre el botón
OK.

En la ventana Subset Analysis, podrá encontrar los resultados de este análisis por categorías.

42
StatGraphics Centurion XVI.II

La opción le muestra las siguientes opciones de análisis:

 La opción Analysis Summary le muestra la cantidad de datos analizados (en este caso 288), así
como la cantidad de categorías tenidas en cuenta para el análisis (en este caso 2: femenino y
masculino).
 El recuadro Summary Sratistics incluye una tabla con los estadísticos muestrales para cada una
de las categorías.

Según este análisis, hay un total de 83 mujeres y 205 hombres en la población analizada. La
estatura media para las mujeres es de 122,97 cm, con una desviación estándar de 14,93 y un
coeficiente de variación de 12, 152%. Por su parte, la esta tura media de los hombres es de
160,84 cm, con una desviación estándar de 14,4862 y un coeficiente de variación igual a
9,6283%. Adicionalmente, se puede observar que mientras la altura máxima de las mujeres de
la población analizada es 155,71, la de los hombre es 199,48. Esta tabla también indica que la
mitad de las mujeres miden más de 122,18 cm y más de la mitad de los hombres tienen una
estatura mayor a 161,4 cm. Ya que el coeficiente de asimetría para la estatura de las mujeres
es positiva, esta variable tiene una distribución asimétrica a la derecha, mientras que para los
hombres, esta asimetría está a la izquierda. Finalmente, el coeficiente de curtosis indica que la
distribución para las dos variables resulta platicúrtica, es decir con una baja concentración de
los datos en torno a la media.

43
StatGraphics Centurion XVI.II

Si desea conocer otros estadísticos muéstrales calculados, puede hacer clic derecho sobre este panel y
seleccionar la opción Pane Options.

 Si selecciona la opción Means Table, en el panel con este nombre aparecerá una tabla con las
medias muestrales y errores estandar de cada una de las categorias, además de los intervalos
representados por la media más o menos el error estándar.

Si desea modificar el tipo de información que se presenta en este panel, solo debe hacer clic derecho
sobre el mismo y seleccionar la opción Pane Options. El programa le mostrará un cuadro en el que
podrá modificar algunos parámetros.

Algunos resultados obtenidos de este análisis se representan en el gráfico de dispersión o el de caja y


bigotes que mostrados a continuación.

Scatterplot

210

190

170
ESTATURA

150

130

110

90
Femenino Masculino
GÉNERO

44
StatGraphics Centurion XVI.II

Box-and-Whisker Plot

GÉNERO Femenino

Masculino

90 110 130 150 170 190 210


ESTATURA

Análisis de Múltiples Variables


El análisis de correlación emplea métodos para medir la significación del grado o intensidad de
asociación entre dos o más variables. El concepto de correlación está estrechamente relacionado con el
concepto de regresión, pues, para que una ecuación de regresión sea razonable los puntos muestrales
deben estar ceñidos a la ecuación de regresión; además el coeficiente de correlación debe ser grande
cuando el grado de asociación es alto (cerca de 1 o -1), y pequeño cuando es bajo (cerca de cero),
independiente de las unidades en que se miden las variables.

StatGraphics posee la función de Análisis de multivariado para hacer el proceso de análisis de


correlación. Para acceder a él, seleccione la opción Describe en la barra de menú. En el menú
desplegable seleccione la opción Numeric Data, y en el submenú que allí encontrará, seleccione la
opción Multiple-Variable Analysis.

Al hacer esta selección, emergerá el siguiente cuadro.

45
StatGraphics Centurion XVI.II

En este, usted podrá seleccionar las variables que desea analizar. El botón Transform le permite incluir
funciones dependientes de cualquiera de las variables que vaya a incluir en el análisis. Después de que
haya hecho la elección de las variables de su interés, haga clic en el botón OK para visualizar los
resultados, que serán mostrados en la ventana Multiple-Variable Analysis.

Al abrirse esta ventana, se activará la Barra de Herramientas de Análisis.

Esta barra cuenta con las siguientes funciones:

El botón le mostrará nuevamente el cuadro de selección de variables, en el que podrá hacer las
modificaciones que considere necesarias. Al cerrar este cuadro con la opción OK, se modificarán

automáticamente los resultados obtenidos previamente. El botón le permitirá seleccionar los


resultados que desee visualizar en el panel de resultados de la ventana Multiple-Variable Analysis. Al
hacer clic sobre este, emergerá el siguiente cuadro de selección.

46
StatGraphics Centurion XVI.II

Las opciones que le ofrece este cuadro son:


 Analysis Summary: En este se presenta un resumen de los componentes y de las
características del de análisis realizado.
 Summary Statistics: En este panel, encontrará una tabla con el resumen de las estadísticas
para cada una de las variables incluidas en el análisis. Esta tabla incluye medidas de tendencia
central, medidas de variabilidad y medidas de forma. Los resultados de esta tabla que podrían
ser de particular interés, son la asimetría y la curtosis normalizada estandarizada, las cuales
pueden ser utilizadas para determinar si la muestra viene de proviene de una distribución
normal.
 Confidence intervals: En este panel encontrará dos tablas. La primera muestra los intervalos
de confianza del 95% para las medias y las desviaciones estándar de cada una de las variables;
la segunda muestra los errores de estimación ligado a estos intervalos de confianza. Los
intervalos de confianza son generados bajo el supuesto de que las muestras pueden ser
representadas por distribuciones normales. Se debe tener en cuenta que estos intervalos de
confianza para las medias son bastante robustos y no muy sensibles a las violaciones de la
suposición de normalidad, mientras que los intervalos de confianza de las desviaciones
estándar si son muy sensibles.
 Correlations: En este panel encontrará una matriz con la siguiente información: En primer
lugar, el coeficiente de correlación de Pearson para cada par de variables. Estos coeficientes de
correlación oscilan entre -1 y 1 y miden la fuerza de relación lineal entre las variables. Debajo
de este, se muestra en paréntesis, la cantidad de pares de valores que fueron utilizados para
hacer el cálculo de cada coeficiente. El tercer número, es un P-valor que pone a prueba la
significancia estadística de las correlaciones estimadas. Los P-valores inferiores a 0,05 indican
correlaciones no-cero estadísticamente significativas en el nivel de confianza 95%.
 Rank Correlations: En este panel, encontrará una matriz con la siguiente información. En
primer lugar, se encuentran los coeficientes de correlación de Spearman para cada par de
variables. Estos coeficientes de correlación oscilan entre -1 y 1 y miden la fuerza de la
oscilación entre las variables. Los coeficientes de Spearman se calculan a partir de las filas de
los valores de los datos y no de los propios valores. A continuación, se muestra en paréntesis la
cantidad de pares de datos utilizados para calcular cada coeficiente. El tercer número de cada
entrada de la matriz es un P-valor que pone a prueba la significancia estadística de las
correlaciones estimadas. P-valores inferiores a 0,05 indican correlaciones no nulas
estadísticamente significativas en el nivel de confianza 95%.
 Covariances: En este recuadro encontrará una tabla con la covarianza estimada para cada par
de variables. Esta covarianza determina si existe o no una dependencia directa, inversa o nula
entre las variables de análisis; esta información también es usada para medir la correlación

47
StatGraphics Centurion XVI.II

producto momento de Pearson. En la tabla encontrará un dato en paréntesis, los cuales


indican la cantidad de dato que han sido tomados para las estimaciones realizadas.
 Partial Correlatión: En la tabla que encontrará en este panel podrá observar los coeficientes
de correlación parcial obtenidos para cada par de variables. Este nivel parcial de correlación
mide la fuerza de relación lineal encontrada entre las variables. En cada entrada de la tabla,
encontrará adicionalmente escrito en paréntesis el número de datos que se usaron para
determinar la correlación, así como el p-valor usado para medir la significancia estadística de la
estimación realizada.
Regresión lineal Simple
El proceso de regresión simple tiene como objeto estudiar cómo los cambios en una variable, no
aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas
variables que puede ser establecida por una expresión lineal. (Aula Virtual de Bioestadística, 2014). Una
de las finalidades de este análisis es realizar predicciones a cerca del comportamiento de una variable.

Para elaborar una regresión lineal Simple en StatGraphics, se debe agregar inicialmente los datos que
se desean relacionar en la tabla de datos, de cualquiera de las formas indicadas en la sección
Introducción de datos en StatGraphics. A continuación se debe establecer cuál será la variable
dependiente e independiente. Para esto haga clic en la opción Relate que encontrará en la barra de
menú. En el menú que se despliega, seleccione la opción One factor y posteriormente seleccione la
opción Simple Regression.

Al hacer esto, emergerá la siguiente ventana en la que podrá hacer la definición de las variables.

En el espacio Y, debe agregar la columna que tenga las observaciones hechas, mientras que en X debe
agregar la columna que contiene los datos de la variable independiente. A continuación haga clic en OK
y observe en la ventana emergente, Simple Regression, el análisis realizado.

48
StatGraphics Centurion XVI.II

Estos resultados están distribuidos en cuatro paneles. El primero, es el resumen del análisis y muestra
toda la información acerca del modelo ajustado. En este cuadro se especifican las variables y el modelo
al que fueron ajustados los datos. El cuadro de coeficientes muestra no solo los coeficientes estimados,
sino también los errores estándares, los estadísticos y los p-valores. En el cuadro de Análisis de varianza
se descompone la variabilidad de la variable dependiente en un modelo de suma de cuadrados y de
suma de cuadrados de los errores. Adicionalmente esta la prueba F y de P-valor que prueban la
significancia estadística del modelo ajustado. Finalmente, se muestra el resumen estadísitco para el
modelo ajsutado, en el que se incluye: Coeficiente de correlación, R-squared, R-squared ajustada,
error estándar del estimador, error absoluto medio, el estadístico Darbin-Watson y el rezago 1 en la
auto-correlación de los residuos.

En el panel inferior izquierdo encontrará la tabla de los residuos inusuales en la que se enumeran todas
las observaciones que se han estudentizado con residuos superiores a dos en valor absoluto.

En el panel superior derecho, se encuentra la gráfica del modelo ajustado. Al hace doble clic sobre la
gráfica, esta se expandirá en toda la ventana de Regresión simple. Al hacer clic derecho sobre ella, se

49
StatGraphics Centurion XVI.II

desplegara un menú que le permitirá modificar (Graphics Options), revisar (Locate) y guardar, copiar o
imprimir la gráfica en diferentes instancias.

En el panel inferior derecho, se presenta el gráfico de los residuos del modelo ajustado, el cual tiene las
mismas propiedades de edición que la gráfica presentada previamente. Si se desea ver el gráfico de
errores estudentizados, solo debe hacer clic derecho sobre la gráfica y seleccionar las opciones Pane
Options.

Emergerá un cuadro que le mostrará las opciones de gráficas que pueden ser creadas. Basta con que se
seleccione la deseada y obtendrá en el mismo panel la nueva gráfica solicitada.

De otro lado, al hacer clic derecho sobre la ventana Simple Regression encontrará un menú desplegable
en el que encontrará la opción Analysis Options.

50
StatGraphics Centurion XVI.II

Esta selección lo llevará a una ventana en la que podrá escoger el tipo de modelo que desea aplicar y
otros ajustes alternos.

En el panel Tipo de modelo, puede seleccionar el modelo al que desea ajustar los datos previamente
seleccionados. El prodedimiento que hace StratGraphics consiste en transformar los datos, ajustar el
modelo e invertir la transformación para mostrar los resultados. Al finalizar su elección y hacer clic en
el botón OK, el análisis será revelado automáticamente en una nueva ventana de Regresión Simple.

El panel Alternative Fit le mostrará algunas opciones de ajuste alternativo de estimación en modelo
que haya escogido. Esta selección añadirá un conjunto adicional de estimadores al resultado. En este
panel encontrará dos opciones disponibles: Minimize absolute deviation la cual minimiza la suma de
los valores absolutos de las desviaciones alrededor del modelo ajustado. Use medians of 3 groups la
cual divide los datos en tres grupos de acuerdo con los valores de Z y se estiman las mediana para cada
grupo. Finalmente estas medias son unidas por una línea. (StatPoint.Inc, 2007)

StatGraphics le brindará una interpretación de los resultados obtenido en el análisis previamente


hecho. Esta interpretación la puede ver tanto en la ventana StatAdvisor como en el cuadro Simple
Regression.

51
StatGraphics Centurion XVI.II

Siempre que tenga activa la ventana Simple Regression, la barra de Herramientas de Análisis le ofrecerá
diversas alternativas que complementarán su análisis.

Las opciones de esta barra ya han sido analizadas en la sección precedente y las funciones son análogas
para los resultados de la regresión simple.

Ejemplo de regresión Simple.


Se tienen los datos de consumo e impuestos en un país correspondiente a diferentes periodos. Se
quiere establecer el tipo de relación que puede existir entre estas dos variables por medio de una
regresión lineal. Específicamente, se pretende describir el nivel de consumo de la población en función
del nivel tributario del país, para descubrir el posible efecto que puede tener un alto nivel de impuestos
sobre el consumo de la población.

En este caso, se insertan los datos desde un archivo en formato .xls de la forma explicada en la sección
Introducción de datos en StatGraphics. En la primera columna estará ubicado el periodo, en la segunda
el nivel de consumo y en la tercer columna el nivel de impuestos totales correspondiente a cada
periodo.

52
StatGraphics Centurion XVI.II

Seleccione la opción simple regresión como se indicó previamente y en el cuadró emergente ubique las
variables en los campos correspondiente. En este caso la variable independiente X será el nivel de
impuestos, mientras que el consumo será la variable dependiente Y.

Al terminar esta selección, pulse el botón OK y verá en el cuadro Simple Regression los resultados de
dicho análisis.

En el panel Analysis Summary, encontrará un resumen de todo el proceso de regresión. Se detalla la


estimación de los parámetros y se muestra el modelo estimado con la regresión. La ecuación del
modelo resultante es:

Donde es el consumo e es el nivel de impuestos. Se concluye que hay una relación estadísticamente
significativa entre Consumo e Impuestos al nivel de confianza de 95%. El coeficiente de correlación es
igual a 0,996311, lo cual indica que hay una relación relativamente fuerte entre las variables.

El panel del gráfico del modelo estimado evidencia la relación existente entre las variables Consumo e
Impuestos totales.

53
StatGraphics Centurion XVI.II

En la Barra de análisis podrá seleccionar la visualización de resultados más específicos y el StatAdvisor


lo guiará en la interpretación de los resultados.

Para realizar predicciones sobre las variables, haga clic sobre el icono que encontrará en la Barra
de Análisis y seleccione la opción Forecasts en el siguiente cuadro de dialogo.

En el cuadro Simple Regression encontrará el panel de predicciones. En este cuadro se presentarán los
intervalos de confianza para las estimaciones del nivel de consumo dependiendo de un nivel de
impuestos totales previamente definido.

Si desea modificar los valores de la variable X para los que desean hacer la predicción o cambiar el nivel
de confianza de los intervalos, haga clic derecho sobre este panel y seleccione la opción Pane Options.
En el siguiente cuadro de dialogo podrá hacer tales modificaciones e incluir más valores para predecir.

54
StatGraphics Centurion XVI.II

Regresión Lineal Múltiple


El objetivo general de la regresión múltiple es tratar de expresar una variable respuesta (numérica) en
función de varias posibles variables explicativas (todas ellas numéricas). (De la Horra, 2014).

Para hacer una Regresión Lineal Múltiple en StatGraphics, Seleccione la opción Relate en la Barra de
Menú. En la opción Multiple Factors encontrará un menú en el que debe hacer clic sobre la opción
Multiple Regression.

A continuación, se abrirá el siguiente cuadro de dialogo en el que debe seleccionar la variable


independiente y las variables independientes que va a analizar.

Para seleccionar cada una de estas variables, haga clic sobre la variable que vaya a asignar y seleccione
la flecha frente a la categoría donde quiera incluirla.

55
StatGraphics Centurion XVI.II

StatGraphics le ofrece la opción de hacer el análisis para transformaciones de las variables; para ello
haga clic en el botón Transform que encontrará en la parte inferior del cuadro Multiple Regression.
Esta opción le abrirá la siguiente ventana en la que podrá hacer uso de las variables y de un conjunto
de funciones y operadores haciendo clic sobre el que desee.

Después de hacer la selección de la variable dependiente y las independientes, haga clic en el botón
OK.

Los resultados de la regresión se presentarán en la barra titulada Multiple Regression. Al igual que en
regresión Lineal Simple, se activará la barra de Herramientas de Análisis. El icono le permite hacer

modificaciones a los parámetros iniciales del análisis. El icono proporciona un cuadro que
contiene todos los posibles resultados que se pueden mostrar en la ventana de Multiple Regression.

 Análisis Summary: La primera opción, aparece señalada por defecto. En esta se


muestra un resumen de los resultados generales de la regresión.
 Conditional Sums of Squares: Esta tabla muestra la significancia estadística de cada
variable. Esta significancia se mide a partir de la suma de cuadrados de los valores
observados y la media de los cuadrados de los mismos. Adicionalmente se muestra el
P-Valor usado para cada estimación.
 Confidence intervals: En esta tabla se muestran los intervalos de confianza del 95%
de fiabilidad sobre los que se estiman los coeficientes de la regresión múltiple a
partir los datos disponibles y el ruido presente.
 Correlation Matrix: La matriz de correlación muestra la estimación de las
correlaciones estimadas entre cada par de parámetros. Estas correlaciones son útiles
para la determinación de multicolinealidad grave entre las variables de predicción.

56
StatGraphics Centurion XVI.II

 Reports: Se muestra una tabla que contiene información acerca de la variable


dependiente generada con el modelo esperado. Esta tabla contiene el valor
predictivo de la variable dependiente, el error estándar de cada valor estimado, los
límites de predicción para cada valor estimado y los límites de confianza para la
respuesta media.
 Unusual residuals: La tabla de residuos inusuales enumera todas las observaciones
que tienen residuos estudentizados en valor absoluto mayores que 2. Los residuos
estudentizados miden la cantidad de desviaciones estándar que las observaciones de
la variable dependiente se desvía del modelo estimado a partir de todos los datos
excepto estos.
 Influential points: La tabla de puntos de influencia muestra las observaciones que
tienen valores medios tres veces mayores al punto medio de los datos o los que
tienen un valor DFITS inusualmente grande. El apalancamiento (Leverage) es un
estadístico que mide la influencia de cada observación en la determinación de los
coeficientes del modelo estimado. DFITS es un estadístico que mide que tanto
cambiarían los coeficientes estimados si cada la observación se removiera del
conjunto de datos.

El icono le mostrará el siguiente menú en el que puede encontrar todas las opciones
gráficas de representación de los resultados obtenidos en el proceso.

Al hacer doble clic sobre cualquiera de las gráficas generadas, se activarán las herramientas
gráficas de la tabla de análisis, las cuales permiten hacer modificaciones a los gráficos tanto en
la forma (escala de los ejes, colores, tamaño de los puntos, dispersión, etc.) como en el
contenido (Eliminar variables representadas, modificar las variables representadas en los ejes,
etc).

Ejemplo regresión lineal múltiple.


Se desea expresar el comportamiento del PIB de un país en relación con la inversión, el ahorro, el
consumo, los impuestos y la inflación. Para ello se cuenta con una base de que contiene los datos de
interés con una periodicidad trimestral desde el año 2000 hasta el año 2013.

57
StatGraphics Centurion XVI.II

Inicialmente, insertaremos los datos desde una base de datos en formato .csv como se indicó en la
sección Introducción de datos en StatGraphics.

Una vez insertados los datos, se accede a la opción Multiple Regresión en el menú Relate.

Al hacer esta selección se activará la ventana de análisis de Regresión Múltiple en la que podrá
seleccionar las variables que va a relacionar; en este caso, seleccionamos como variable dependiente el
PIB y como variables independientes todas las demás.

58
StatGraphics Centurion XVI.II

Para ver los resultados del análisis, haga clic en OK. Para este ejemplo los se obtiene:

La ecuación del modelo ajustado estimado es

Dado que el P-valor en la tabla ANOVA es inferior a 0,05, hay una relación estadísticamente
significativa entre las variables en el nivel de confianza 95,0%.

El estadístico R-cuadrado indica que el modelo estimado responde al 99,6766% de la variabilidad en X2.
El estadístico R-cuadrado ajustado, que es más adecuado para comparar modelos con diferentes
números de variables independientes, es 99,6406%. El error estándar de la estimación muestra la
desviación estándar de los residuos, que en este caso es 892,66. Este valor se puede utilizar para
construir los límites de predicción para las nuevas observaciones. El error absoluto medio (MAE) de
665.452 es el valor promedio de los residuos. El Durbin-Watson (DW) pone a prueba los residuos para

59
StatGraphics Centurion XVI.II

determinar si existe alguna correlación significativa basada en el orden en el que aparecen en el


archivo de datos.

Para determinar si el modelo se puede simplificar, observe que el P-valor más alto en las variables
independientes es 0,7811, que pertenece a X6. Dado que el P-valor es mayor o igual a 0,05, ese
término no es estadísticamente significativa en el 95,0% o mayor nivel de confianza. En consecuencia,
debe considerarse la eliminación de la variable que corresponde a la inflación del modelo.

La gráfica del modelo estimado es la siguiente:

Component+Residual Plot for X2


(X 1000,0)
11

7
component effect

-1

-5

-9
9 14 19 24 29 34
(X 1000,0)
Y

Para este tipo de análisis puede resultar útil analizar la correlación existente entre cada par de

variables. Para ello, haga clic en la Barra de Herramientas de Análisis sobre el botón y seleccione la
opción Correlation Matrix.

Si desea apreciar gráficamente estos resultados, diríjase a la barra de Menú y seleccione el icono de

gráficos de dispersión . Al hacer clic sobre este botón, se abrirá la siguiente ventana de selección.

60
StatGraphics Centurion XVI.II

Seleccione las variables que va a relacionar y pulse el botón OK.

Este gráfico permite ver en forma sencilla, las diferentes relaciones existentes entre cada par de
variables que intervienen en el modelo.

CONCLUSIONES

La exploración del software StatGraphics Centurión XVI.II permite resaltar la utilidad de este programa
en diversos procesos estadísticos. La ventaja más notable de este software frente a otros estadísticos
es la de contar con una interpretación de los resultados en cada uno de los procesos, dándole al
usuario una idea detallada del significado de los resultados obtenidos.

La investigación desarrollada hasta el momento permite considerar este programa como pertinente y
útil para la materia probabilidad y estadística de la Facultad de Ciencias Económicas. Adicionalmente,
se ha encontrado que el programa cuenta con herramientas que hacen parte de diversos procesos
econométricos, sin embargo aún no se puede concluir que este sea el software más adecuado para

61
StatGraphics Centurion XVI.II

materias como econometría y tópicos de econometría ni mucho menos que pueda reemplazar los
programas actualmente implementados en estas asignaturas.

Una de las principales críticas que puede recibir este programa es la imposibilidad de acceder al código
fuente y hace modificaciones de este. A pesar de ser un programa fácil de usar, por ser muy intuitivo,
puede resultar limitado para realizar procesos que tengan características muy específicas.

Adicionalmente, el hecho de que StatGraphics sea un software privativo, hace que sea menos atractivo
para estudiantes de ciencias económicas no solo porque su adquisición resulta económicamente
limitada, sino porque actualmente se cuenta con software libre para procesos probabilísticos,
estadísticos y econométricos como Gretl y R-project.

62

También podría gustarte