Está en la página 1de 214

Gua para el uso de

StatTools
Programa auxiliar estadstico
para Microsoft

Excel

Versin 6
March, 2013






Palisade Corporation
798 Cascadilla St.
Ithaca, NY 14850
EE.UU.
+1-607-277-8000
+1-607-277-8001 (fax)
http://www.palisade.com (World Wide Web)
sales@palisade.com (correo electrnico)




























Copyright
Copyright 2013, Palisade Corporation.

Reconocimiento de marcas comerciales
Microsoft, Excel y Windows son marcas comerciales registradas de Microsoft Corporation.
IBM es una marca comercial registrada de International Business Machines, Inc.
Palisade, TopRank, BestFit y RISKview son marcas comerciales registradas de Palisade
Corporation.
Bienvenidos a StatTools para Excel i

Bienvenidos a StatTools para
Excel
Bienvenidos
StatTools ofrece a Microsoft Excel el programa de modelacin y
anlisis de datos estndar de la industria- un nuevo y eficaz grupo de
herramientas estadsticas. StatTools es un programa auxiliar
estadstico para Microsoft Excel que permite analizar datos en las
hojas de clculo de Excel y trabajar en el entorno familiar de Microsoft
Office. Combinando un eficaz administrador de datos con anlisis que
compiten con los mejores programas estadsticos disponibles,
StatTools le ofrece lo mejor de dos mundos: la facilidad de uso y los
informes de Microsoft Office y la eficacia estadstica.
Trabaje con la mayor comodidad
Si sabe cmo usar Excel, sabr usar StatTools. StatTools funciona
como lo hace Excel, con barras de herramientas, mens y funciones
personalizadas de hojas de trabajo, y todo ello dentro de Excel. A
diferencia de los programas estadsticos de funcionamiento
independiente, con StatTools no hay una pronunciada curva de
aprendizaje ni costos iniciales de formacin, porque se trabaja como
usted trabaja en Excel. Los datos y variables estn en hojas de clculo
de Excel. Puede usar frmulas estndar de Excel para hacer clculos y
transformaciones as como tablas de pivote y ordenacin de Excel. Los
informes y grficas de los anlisis estadsticos se ofrecen en el formato
estndar de Excel y pueden utilizar todas las funciones de formato
incorporadas de Excel.

ii Bienvenidos

Estadstica eficaz dentro de Excel
StatTools reemplaza los clculos estadsticos incorporados a Excel por
sus propios clculos rpidos y eficaces. La exactitud de los clculos
estadsticos incorporados a Excel se ha cuestionado con frecuencia, y
StatTools no utiliza ninguno de estos clculos. Incluso las funciones
estadsticas de las hojas de clculo de Excel como STDEV() han sido
reemplazadas por nuevas versiones ms eficaces de StatTools, como
StatSTDEV(). Los clculos estadsticos de StatTools superan las ms
altas pruebas de exactitud, con un funcionamiento optimizado
mediante el uso de archivos DLL de C++, no clculos por macro.
Anlisis de StatTools
StatTools cubre la gama de uso ms comn de procedimientos
estadsticos, y ofrece una capacidad sin precedentes de aadir nuevos
anlisis personalizados. Una amplia gama de 36 procedimientos
estadsticos, adems de 8 utilidades de datos incorporadas, permiten
cubrir la ms amplia variedad de anlisis estadsticos. Las funciones
estadsticas que se proporcionan incluyen estadsticas descriptivas,
pruebas de normalidad, comparaciones de grupo, correlacin, anlisis
de regresin, control de calidad, previsiones, etc. Aada a esto una
biblioteca de procedimientos personalizados (escritos por nuestro
personal u otros expertos en la materia) y ver un grupo de
programas estadsticos completo y personalizable, dentro del propio
Excel.
StatTools ofrece adems clculos estadsticos en vivo con enlaces
activos. Si cambia un valor en Excel, la hoja de clculo se recalcula y
genera una nueva respuesta. Lo mismo sucede en StatTools. Cambie
un valor del conjunto de datos y el informe estadstico se actualiza
automticamente. StatTools usa una serie de eficaces funciones de
hoja de clculo personalizadas para asegurarse de que las estadsticas
que aparecen en los informes estn siempre actualizadas con los datos
actuales.
Bienvenidos a StatTools para Excel iii

Administracin de datos con StatTools
StatTools proporciona un completo administrador de conjuntos de
datos y variables dentro del propio Excel, de la misma forma que lo
hacen los programas estadsticos independientes. Se puede definir un
nmero ilimitado de conjuntos de datos, cada uno con las variables
que desea analizar, directamente en los datos de Excel. StatTools
evala inteligentemente los bloques de datos, sugiriendo nombres de
variables y la ubicacin de datos. Los conjuntos de datos y variables
pueden residir en diferentes libros de trabajo y hojas de clculo,
permitindole organizar los datos como mejor le convenga. Luego,
puede ejecutar anlisis estadsticos que hacen referencia a las
variables, en lugar de tener que seleccionar de nuevo los datos una y
otra vez en Excel. Y las variables de StatTools no estn limitadas en su
tamao a una sola columna de datos de una hoja de clculo de Excel;
puede usar la misma columna a travs de mltiples hojas de clculo
para una sola variable. Las versiones de Excel 2007 y posterior tienen
ms de un milln de filas en una sola hoja de clculo, y no limitan el
nmero de hojas de clculo de cada libro de trabajo. Esto significa que
el nmero de casos que StatTools Industrial Edition puede analizar
slo tiene el lmite de la cantidad de memoria disponible. Con Excel
2003, el nmero de casos se limita a 16.7 millones: 65536 (nmero de
filas en una hoja de clculo) x 255 (nmero mximo de hojas de
clculo en un libro de trabajo). StatTools Professional tiene el lmite de
10,000 casos.
Los informes de StatTools
Excel es ideal para informes y grficos, y StatTools lo aprovecha al
mximo. StatTools usa grficos con formato de Excel, que se pueden
personalizar fcilmente con nuevos colores, fuentes y texto. Los ttulos
de los informes, formato de los nmeros y texto se puede cambiar
como en cualquier hoja de clculo estndar de Excel. Arrastre y
coloque tablas y grficas de los informes de StatTools directamente a
sus propios documentos de otras aplicaciones. Las grficas y tablas
permanecen enlazadas a los datos de Excel, as que cada vez que
cambien los informes de anlisis, su documento se actualiza
automticamente.

iv Bienvenidos

Acceso y distribucin de datos
Excel tiene excelentes funciones de importacin de datos e incorporar
datos existentes a StatTools es muy fcil. Use las funciones estndar
de Excel para importar datos de Microsoft SQL Server, Oracle,
Microsoft Access o cualquier otra base de datos que respalde ODBC.
Cargue datos de archivos de texto o de otras aplicaciones; si lo puede
introducir en Excel, lo puede usar en StatTools.
StatTools almacena todos los resultados y datos en libros de trabajo de
Excel. Como con cualquier otro archivo de Excel, podr enviar
resultados y datos de StatTools a sus colegas. Compartir datos no
puede ser ms fcil.

ndice v

ndice

Captulo 1: Para empezar 1
Introduccin........................................................................................3
Informacin sobre esta versin............................................................. 3
El sistema operativo................................................................................ 3
Cmo obtener ayuda............................................................................... 3
Requisitos del sistema para StatTools................................................. 5
Instrucciones para la instalacin......................................................7
Instrucciones generales de instalacin................................................ 7
Configuracin de los iconos y de los accesos directos
de StatTools.............................................................................................. 7
Los programas de DecisionTools Suite............................................... 8
Activacin del software......................................................................9
Captulo 2: Introduccin a StatTools 11
Introduccin......................................................................................13
El men y la barra de herramientas de StatTools............................ 13
Conjuntos de datos y el Administrador de Datos........................... 14
Informes y grficas de StatTools........................................................ 16
Captulo 3: Gua de referencia de StatTools 19
Introduccin......................................................................................23
Lenguaje de macros y kit para programadores de StatTools ........ 23
Gua de referencia: Iconos de StatTools 25
La barra de herramientas de StatTools..........................................25
Gua de referencia: Comandos del men de StatTools 29
Introduccin......................................................................................29
Lista de comandos ...........................................................................31

vi

El men de StatTools Conjunto de datos................................... 39
El comando Administrador de conjunto de datos........................... 39
El men Utilidades de datos ........................................................... 45
El comando Agrupar ............................................................................. 45
El comando Desagrupar ....................................................................... 48
El comando Transformar...................................................................... 49
El comando Retrasar ............................................................................. 51
El comando Diferencia......................................................................... 53
El comando Interaccin........................................................................ 55
El comando Combinacin.................................................................... 57
El comando Falso................................................................................... 59
El comando Muestra aleatoria............................................................. 61
El men Estadstica de resumen.................................................... 63
El comando Resumen de una variable .............................................. 63
El comando Correlacin y covarianza................................................ 66
El men Grficos de resumen ........................................................ 69
El comando Histograma....................................................................... 69
El comando Diagrama de dispersin................................................. 72
El comando Diagrama de cajas-bigotes............................................. 74
El men Inferencia estadstica........................................................ 77
El comando Intervalo de confianza Media/desviacin estndar77
El comando Intervalo de confianza Proporcin............................ 80
El comando Prueba de hiptesis Media/desviacin estndar.... 83
El comando Prueba de hiptesis Proporcin................................. 86
El comando Seleccin de tamao de la muestra.............................. 89
El comando ANOVA de una direccin ............................................. 91
El comando ANOVA de dos direcciones .......................................... 94
El comando Prueba de independencia Chi-cuadrado..................... 96
El men Pruebas de normalidad .................................................... 99
El comando Prueba de normalidad Chi-cuadrado .......................... 99
El comando Prueba Lilliefors............................................................ 103
El comando Diagrama normal Q-Q................................................. 106
El men Series de tiempo y previsin ......................................... 109
El comando Grfico de series de tiempo......................................... 109
El comando Autocorrelacin............................................................. 111
El comando Prueba de ejecuciones para aleatoriedad.................. 113
El comando Previsin......................................................................... 115
ndice vii

Men Regresin y clasificacin....................................................121
El comando Regresin........................................................................ 121
El comando Regresin logstica........................................................ 126
El comando Anlisis discriminatorio .............................................. 130
El men Control de calidad ...........................................................135
El comando Grfica de Pareto........................................................... 135
El comando Grficas X/R................................................................... 138
El comando Grfica P ......................................................................... 142
El comando Grfica C......................................................................... 146
El comando Grfica U......................................................................... 149
El men Pruebas no paramtricas................................................153
El comando Prueba del signo............................................................ 155
El comando Prueba de los signos de Wilcoxon ............................. 158
El comando Prueba de Mann-Whitney ........................................... 161
El men Utilidades..........................................................................165
El comando Configuraciones de aplicacin ................................... 165
El comando Eliminar conjuntos de datos ....................................... 172
El comando Borrar memoria del cuadro de dilogo...................... 172
El comando Descargar complemento StatTools ............................ 172
El men Ayuda................................................................................173
Ayuda de StatTools............................................................................. 173
Manual electrnico ............................................................................. 173
El comando Activacin de licencia................................................... 173
El comando Acerca de......................................................................... 173
Gua de referencia: Funciones de StatTools 175
Introduccin....................................................................................175
Las funciones de StatTools y las funciones de Excel.................... 176
Funciones de distribucin ................................................................. 177
Informes en vivo.............................................................................. 178
Gua de referencia: Lista de funciones estadsticas...................181
Tabla de funciones disponibles ....................................................... 181
Descripciones detalladas de las funciones..................................... 185
ndice 203


viii



Captulo 1: Para empezar 1

Captulo 1: Para empezar
Introduccin 3
Informacin sobre esta versin............................................................. 3
El sistema operativo................................................................................ 3
Cmo obtener ayuda............................................................................... 3
Requisitos del sistema para StatTools................................................. 5
Instrucciones para la instalacin......................................................7
Instrucciones generales de instalacin................................................ 7
Configuracin de los iconos y de los accesos directos
de StatTools.............................................................................................. 7
Los programas de DecisionTools Suite............................................... 8
Activacin del software......................................................................9

@RISK 4.5 Help System Palisade Corporation, 1999




2



Captulo 1: Para empezar 3

Introduccin
Esta introduccin describe los contenidos del paquete de StatTools y
explica cmo instalar StatTools e incorporarlo a su copia de Microsoft
Excel.
Informacin sobre esta versin
Esta versin de StatTools se puede instalar con Microsoft Excel 2003 o
posterior.

El sistema operativo
Esta gua para el uso del programa est diseada para usuarios que
tienen un conocimiento general del sistema operativo Windows y de
Excel. En particular, el usuario debe:
Estar familiarizado con el uso del PC y del ratn.
Estar familiarizado con trminos como iconos, hacer clic, hacer doble clic,
men, ventana, comando y objeto.
Comprender los conceptos bsicos de estructura de directorios y
archivos.
Cmo obtener ayuda
Se ofrece asistencia tcnica gratuita a todos los usuarios registrados de
StatTools con un plan actual de mantenimiento, o tambin se ofrece
por un precio por incidente. Para asegurar que usted es un usuario
registrado de StatTools, regstrese electrnicamente en
http://www.palisade.com/support/register.asp.
Si se pone en contacto con nosotros por telfono, tenga a mano el
nmero de serie y la Gua para el Uso del programa. Le podremos
asistir mejor si se encuentra delante del PC en el momento de llamar.
Antes de ponerse en contacto con el servicio de asistencia tcnica,
repase la siguiente lista:
Ha consultado la ayuda electrnica?
Ha consultado esta Gua de Uso y revisado el tutorial multimedia
electrnico?
Ha ledo el archivo LEAME.WRI? Este archivo contiene informacin
actual referente a StatTools que puede no estar en la gua del programa.
Puede reproducir el problema consistentemente? Puede reproducir el
problema en otro PC o con otro modelo?
Antes de llamar

4 Introduccin

Ha visitado nuestra pgina de World Wide Web? La direccin es
http://www.palisade.com. En nuestra pgina Web tambin podr
encontrar las preguntas ms frecuentes (una base de datos de preguntas
y respuestas sobre temas tcnicos) y una serie de archivos de reparacin
de StatTools en la seccin de Asistencia Tcnica. Recomendamos que
visite nuestra pgina Web con regularidad para obtener informacin
actualizada sobre StatTools y sobre otros programas de Palisade.
Palisade Corporation est abierto a sus preguntas, comentarios y
sugerencias referentes a StatTools. Pngase en contacto con nuestro
personal de asistencia tcnica siguiendo uno de estos mtodos:
Enve un correo electrnico a support@palisade.com.
Llame al telfono +1-607-277-8000 los das laborables de 9:00 a.m. a
5:00 p.m., hora estndar del este de Estados Unidos. Para acceder al
servicio de asistencia tcnica siga las indicaciones del sistema.
Enve un fax al +1-607-277-8001
Enve una carta postal a:
Asistencia Tcnica
Palisade Corporation
798 Cascadilla St.
Ithaca, NY 14850
EE.UU.
Si quiere ponerse en contacto con Palisade en Europa.
Enve correo electrnico a support@palisade-europe.com.
Llame al telfono +44 1895425050 (Reino Unido).
Enve un fax al +44 1895425051 (Reino Unido).
Enve una carta postal a:
Palisade Europe
31 The Green
West Drayton
Middlesex
UB7 7PN
Reino Unido
Cmo ponerse en
contacto con
Palisade

Captulo 1: Para empezar 5

Si quiere ponerse en contacto con Palisade en Asia-Pacfico.
Enve correo electrnico a support@palisade.com.au.
Llame al telfono +61 2 9252 5922 (Australia).
Enve un fax al +61 2 9252 2820 (Australia).
Enve una carta postal a:
Palisade Asia-Pacific Pty Limited
Suite 404, Level 4
20 Loftus Street
Sydney NSW 2000
Australia
Independientemente del mtodo de contacto, mencione siempre el
nombre del producto, la versin y el nmero de serie. La versin
exacta se encuentra seleccionando el comando Acerca de de la
Ayuda del men de StatTools en Excel.
La versin para estudiantes de StatTools no incluye asistencia tcnica
por telfono. Si necesita ayuda, recomendamos las siguientes
alternativas:
Consulte con su profesor o asistente.
Vaya a http://www.palisade.com y busque entre las respuestas a las
preguntas ms frecuentes.
Pngase en contacto con nuestro departamento de asistencia tcnica
enviando un fax o mensajes de correo electrnico.
Requisitos del sistema para StatTools
Los requisitos del sistema de StatTools para Microsoft Excel para
Windows son los siguientes:
Microsoft Windows XP o superior.
Microsoft Excel 2003 o posterior.
Versin para
estudiantes

6



Captulo 1: Para empezar 7

Instrucciones para la instalacin
Instrucciones generales de instalacin
El programa de instalacin copia los archivos del sistema de StatTools
en el directorio seleccionado del disco duro. Para ejecutar el programa
de instalacin en Windows XP o posterior:
1) Haga doble clic en StatTools Setup.exe, en el archivo descargado o en el
CD de instalacin, y siga las instrucciones de la pantalla
Si tiene algn problema instalando StatTools, compruebe que hay
espacio suficiente en el disco en el que va a instalar el programa. Si
falta espacio, libere el espacio de disco que sea necesario e intente
instalar el programa de nuevo.
Si quiere quitar StatTools de su PC, use la utilidad Agregar/Quitar
Programas del Panel de Control y seleccione StatTools.
Configuracin de los iconos y de los accesos
directos de StatTools
En Windows, el programa de instalacin crea automticamente un
comando de StatTools en el men Programas\Palisade DecisionTools
de la barra de herramientas. Pero si tiene algn problema durante la
instalacin, o si desea hacerlo manualmente en otro momento, siga
estas instrucciones: Recuerde que las instrucciones que se dan a
continuacin son para Windows XP Professional. Las instrucciones
para otros sistemas operativos pueden ser diferentes.
1) Haga clic en el botn Inicio y luego en Configuracin.
2) Haga clic en Barra de Tareas y Men Inicio, y luego haga clic en la
pestaa Men Inicio.
3) Haga clic en Personalizar, haga clic en Aadir y luego en Examinar.
4) Haga clic en Barra de Tareas y Men Inicio, y luego haga clic en la
pestaa Men Inicio.
5) Haga clic en Siguiente y luego doble clic en el men en el que quiere que
aparezca el programa.
6) Escriba el nombre StatTools y luego haga clic en Terminar.
7) Haga clic en Aceptar en todos los cuadros de dilogo.
Cmo quitar
StatTools de
su PC
Creacin de los
accesos directos
en la barra de
tareas de
Windows

8 Instrucciones para la instalacin

Los programas de DecisionTools Suite
StatTools forma parte de DecisionTools Suite, un juego de productos
de anlisis de riesgo y decisin que ofrece Palisade Corporation. El
procedimiento de instalacin predeterminado de StatTools coloca
StatTools en un subdirectorio del directorio principal Archivos de
programas\Palisade. Algo similar ocurre con Excel, que
normalmente se instala como un subdirectorio del directorio
Microsoft Office.
Uno de los subdirectorios del directorio Archivos de
programas\Palisade ser el directorio de StatTools (denominado de
forma predeterminada StatTools6). Este directorio contiene el archivo
del programa de complemento Evolver (STATTOOLS.XLA) adems
de modelos de ejemplo y otros archivos necesarios para el
funcionamiento de StatTools. Otro de los subdirectorios de Archivos
de programas\Palisade es el directorio SYSTEM, que contiene
archivos necesarios para todos los programas de DecisionTools Suite,
incluyendo archivos comunes de ayuda y libreras de programas.


Captulo 1: Para empezar 9

Activacin del software
La activacin es un proceso que se realiza una sola vez para verificar
la licencia y es necesario para que el software de Palisade funcione
como un producto con licencia completa. En la factura impresa o
enviada por correo electrnico se encuentra una ID de activacin, que
es una secuencia separada por guiones similar a esta: "DNA-6438907-
651282-CDM". Si introduce la ID de Activacin durante la instalacin,
el software se activa al final del proceso de instalacin y no ser
necesaria accin adicional alguna. Si desea activar el software despus
de la instalacin, seleccione el comando Administrador de Licencias
del men Ayuda.
El Administrador de Licencias se puede usar para activar, desactivar
y mover licencias de software. Tambin se usa para administrar
licencias en las instalaciones de red. Siga las instrucciones de los
cuadros de dilogo del Administrador de Licencias para realizar las
operaciones que desee con las licencias.

10



Captulo 2: Introduccin a StatTools 11

Captulo 2: Introduccin a
StatTools
Introduccin 13
El men y la barra de herramientas de StatTools............................ 13
Conjuntos de datos y el Administrador de Datos........................... 14
Datos multi-rango.................................................................... 15
Datos agrupados y desagrupados......................................... 15
Tratamiento de los valores que faltan.................................. 16
Informes y grficas de StatTools........................................................ 16
Uso de frmulas en lugar de valores.................................... 17
Uso de comentarios en celdas................................................ 18


12



Captulo 2: Introduccin a StatTools 13

Introduccin
StatTools proporciona excelente capacidad de anlisis estadstico en el
entorno familiar de Microsoft Excel. Los procedimientos de StatTools
como la creacin de diagramas, pruebas de normalidad de variables
o ejecucin de un anlisis de regresin- se pueden realizar en los
propios datos de Excel y los informes y grficas de los anlisis se
crean tambin en Excel.
El men y la barra de herramientas de StatTools
Una vez instalado StatTools en Excel 2003, sus mens y comandos se
incluyen en la barra de mens de Excel. Tambin aparecer una barra
de herramientas de StatTools. En 2007 y posterior, aparecer una cinta
de StatTools.


14 Introduccin

Conjuntos de datos y el Administrador de Datos
StatTools es similar a la mayora de los programas estadsticos de
funcionamiento independiente en el sentido de que est estructurado
alrededor de las variables. En la mayora de los anlisis se trabaja con
un conjunto de datos, o conjunto de variables estadsticas, que
normalmente se encuentran en columnas contiguas con los nombres
de las variables en la primera fila del conjunto de datos. El
Administrador de Datos de StatTools permite definir los conjuntos de
datos y las variables. Luego podr usar estas variables predefinidas en
los anlisis estadsticos, sin tener que seleccionar una y otra vez los
datos que desea analizar.

Cada variable del conjunto de datos tiene asociado un nombre y un
rango de celdas de Excel. Un diseo tpico de variable es el de Una
variable por columna, pero las variables tambin se pueden distribuir
por filas. Un conjunto de datos puede incluir mltiples bloques de
celdas, lo cual permite poner los datos en diferentes hojas de un
mismo libro de trabajo.

Captulo 2: Introduccin a StatTools 15

Cuando se definen conjuntos de datos, StatTools trata de identificar
las variables en el bloque de celdas que rodean a la seleccin actual de
Excel. Esto facilita la configuracin del conjunto de datos con nombres
de variable en la fila superior y las variables distribuidas en columnas.
La longitud de las columnas del conjunto de datos no tiene que ser
igual necesariamente. Por ejemplo, puede tener dos variables,
Peso_Hombres y Peso_Mujeres, con un nmero diferente de
observaciones. Sin embargo, en muchos anlisis, StatTools trata las
celdas en blanco de la columna ms corta como datos que faltan.
En una sola columna de una hoja de clculo de Excel 2003 o anterior
caben hasta 65536 puntos de datos para una variable. Si las variables
tienen ms valores y no quiere actualizar el programa a Excel 2007,
StatTools permite asignar mltiples rangos de celdas a un solo
conjunto de datos. Por ejemplo, puede repetir un conjunto de datos
en mltiples hojas, asignando las mismas columnas a diferentes hojas
de clculo para que quepan todos los valores del conjunto de datos.
Tambin puede usar esta capacidad para asignar diferentes bloques
de celdas de una misma hoja de clculo a un solo conjunto de datos.
Esto es til si los datos estn dispersados en una sola hoja de clculo,
pero quiere combinarlo todo en un solo conjunto de datos.
StatTools respalda datos agrupados y desagrupados. En unos
procedimientos estadsticos es ms fcil trabajar con datos agrupados,
y en otros con datos desagrupados. Por ejemplo, si comparamos
ingresos medios de un hogar en diferentes barrios, en formato
desagrupado habra una variable (o columna) separada Ingresos por
cada barrio. En formato agrupado, habra una variable de valor
Ingresos y una variable de categora Barrios indicando en qu barrio se
encuentra cada hogar.
La utilidad Variable Agrupada de StatTools permite agrupar
variables en dos columnas: una columna de valor, Ingresos, y una
columna de categora, Barrio. Dependiendo del tipo de anlisis, el
conjunto de datos agrupados puede ser ms fcil de usar que la
versin desagrupada.
Datos multi-rango
Datos agrupados
y desagrupados

16 Introduccin

Si al conjunto de datos le faltan valores (algo comn en anlisis
estadsticos) StatTools lo resuelve de forma apropiada dependiendo
de la tarea. Por ejemplo, las medidas de resumen, como las medias o
las desviaciones estndar, ignoran los valores que faltan. Otro
ejemplo: un anlisis de regresin con tres variables slo usa las filas
del conjunto de datos que no tienen valores que faltan en ningn de
las tres variables. (Esto se denomina eliminacin por lista, o por
caso). Un tercer ejemplo: un diagrama de dispersin de dos variables
slo dibuja aquellos puntos en los que ambas variables tienen valores.
Nota: No todos los procedimientos de StatTools admiten valores que
faltan. Consulte la seccin Referencia de este manual para ver como
se tratan los valores que faltan en cada procedimiento.
Informes y grficas de StatTools
Cada vez que StatTools crea salidas numricas, como un informe de
un anlisis de regresin o una tabla de estadsticas de resumen, ofrece
una serie de opciones para la colocacin del informe. Estas opciones
son:
En un nuevo libro de trabajo, cuando se crea un nuevo libro
de trabajo (si fuera necesario) y cada informe se coloca en una
hoja de ese libro de trabajo.
En una nueva hoja de clculo del libro de trabajo activo,
cuando cada informe se coloca en una nueva hoja del libro de
trabajo activo.
Despus de la ltima columna utilizada, cuando cada
informe se coloca en la hoja activa a la derecha de la ltima
columna utilizada.
Celda de inicio, cuando tiene la oportunidad de seleccionar
una celda que ser el ngulo superior izquierdo del informe o
grfico.
Cada vez que StatTools crea una o ms grficas, las coloca con los
informes. Las grficas se crean en formato de Excel y se pueden
personalizar usando comandos de grficos estndar de Excel.
Tratamiento de
los valores que
faltan

Captulo 2: Introduccin a StatTools 17

De forma predeterminada, StatTools trata de que los resultados sean
los ms en vivo posible. Es decir, siempre que resulte prctico, los
informes tienen frmulas que enlazan con los datos originales. Por
ejemplo, supongamos que tiene una variable Peso y quiere medidas de
resumen de Peso, como la media y la desviacin estndar. El
procedimiento de Estadstica de resumen asigna el nombre Peso al
rango de pesos y luego introduce las frmulas en las celdas de salida:
=StatMean(Peso) y =StatStdDev(Peso). StatMean y StatStdDev son
funciones incorporadas de StatTools para calcular la media y la
desviacin estndar. Estas reemplazan a las funciones incorporadas
estndar de Excel de las mismas estadsticas.

Las frmulas se usan en los informes por dos razones. Primero, ayuda
a aprender los procedimientos estadsticos y las funciones de
StatTools en Excel. No slo se ve un resultado numrico; se ve cmo
se forma. Segundo, ofrece la ventaja prctica de que si cambian los
datos, los resultados cambian automticamente, para que no tenga
que ejecutar de nuevo el procedimiento.
Uso de frmulas
en lugar de
valores

18 Introduccin

Sin embargo, a veces no resulta prctico hacer esto. El ejemplo
principal es la regresin. StatTools no proporciona las frmulas que se
usan para crear salidas de regresin; slo proporciona los resultados
numricos. En esos casos, si cambian los datos, deber ejecutar de
nuevo el procedimiento.
StatTools tambin ofrece la opcin de desactivar la actualizacin en
vivo. Esto resulta til si el tiempo de reclculo de Excel se convierte en
un problema cuando se cambian los datos.
Una de las funciones de Excel es su capacidad de incluir comentarios
desplegables en cualquier celda. Se sabe que una celda tiene un
comentario porque hay un pequeo tringulo rojo en el ngulo
superior derecho de la celda. El comentario se puede leer
simplemente colocando el cursor sobre la celda. StatTools aprovecha
estos comentarios para introducir ayuda contextual. Se trata de la
ayuda ms directa de todas las ayudas electrnicas.
Por cierto, si alguna vez hay una hoja de clculo de la que no
desaparecen los comentarios, es decir, siempre aparecen delante de
los datos, seleccione el elemento de men Herramientas/Opciones,
haga clic en la pestaa Visualizar y haga clic en el botn Slo
Indicador de Comentario.

Uso de
comentarios
en celdas

Captulo 3: Gua de referencia de StatTools 19

Captulo 3: Gua de referencia
de StatTools

Introduccin 23
Lenguaje de macros y kit para programadores de StatTools ........ 23
Gua de referencia: Iconos de StatTools 25
La barra de herramientas de StatTools..........................................25
Gua de referencia: Comandos del men de StatTools 29
Introduccin......................................................................................29
Lista de comandos ...........................................................................31
El men de StatTools Conjunto de datos ...................................39
El comando Administrador de conjunto de datos........................... 39
El men Utilidades de datos............................................................45
El comando Agrupar............................................................................. 45
El comando Desagrupar ....................................................................... 48
El comando Transformar ..................................................................... 49
El comando Retrasar ............................................................................. 51
El comando Diferencia......................................................................... 53
El comando Interaccin........................................................................ 55
El comando Combinacin.................................................................... 57
El comando Falso................................................................................... 59
El comando Muestra aleatoria............................................................. 61
El men Estadstica de resumen.....................................................63
El comando Resumen de una variable .............................................. 63
El comando Correlacin y covarianza ............................................... 66
El men Grficos de resumen.........................................................69
El comando Histograma....................................................................... 69
El comando Diagrama de dispersin................................................. 72
El comando Diagrama de cajas-bigotes............................................. 74

20

El men Inferencia estadstica........................................................ 77
El comando Intervalo de confianza Media/desviacin estndar77
El comando Intervalo de confianza Proporcin............................ 80
El comando Prueba de hiptesis Media/desviacin estndar.... 83
El comando Prueba de hiptesis Proporcin................................. 86
El comando Seleccin de tamao de la muestra.............................. 89
El comando ANOVA de una direccin ............................................. 91
El comando ANOVA de dos direcciones .......................................... 94
El comando Prueba de independencia Chi-cuadrado..................... 96
El men Pruebas de normalidad .................................................... 99
El comando Prueba de normalidad Chi-cuadrado .......................... 99
El comando Prueba Lilliefors............................................................ 103
El comando Diagrama normal Q-Q................................................. 106
El men Series de tiempo y previsin ......................................... 109
El comando Grfico de series de tiempo......................................... 109
El comando Autocorrelacin............................................................. 111
El comando Prueba de ejecuciones para aleatoriedad.................. 113
El comando Previsin......................................................................... 115
Men Regresin y clasificacin.................................................... 121
El comando Regresin........................................................................ 121
El comando Regresin logstica........................................................ 126
El comando Anlisis discriminatorio .............................................. 130
El men Control de calidad........................................................... 135
El comando Grfica de Pareto........................................................... 135
El comando Grficas X/R ................................................................... 138
El comando Grfica P ......................................................................... 142
El comando Grfica C......................................................................... 146
El comando Grfica U......................................................................... 149
El men Pruebas no paramtricas ............................................... 153
El comando Prueba del signo............................................................ 155
El comando Prueba de los signos de Wilcoxon.............................. 158
El comando Prueba de Mann-Whitney ........................................... 161
El men Utilidades ......................................................................... 165
El comando Configuraciones de aplicacin ................................... 165
El comando Eliminar conjuntos de datos ....................................... 172
El comando Borrar memoria del cuadro de dilogo...................... 172
El comando Descargar complemento StatTools ............................ 172

Captulo 3: Gua de referencia de StatTools 21

El men Ayuda................................................................................173
Ayuda de StatTools............................................................................. 173
Manual electrnico ............................................................................. 173
El comando Activacin de licencia................................................... 173
El comando Acerca de......................................................................... 173
Gua de referencia: Funciones de StatTools 175
Introduccin....................................................................................175
Las funciones de StatTools y las funciones de Excel.................... 176
Funciones de distribucin ................................................................. 177
Informes en vivo.............................................................................. 178
Gua de referencia: Lista de funciones estadsticas...................181
Tabla de funciones disponibles ....................................................... 181
Descripciones detalladas de las funciones..................................... 185
ndice 203




22



Captulo 3: Gua de referencia de StatTools 23

Introduccin
El captulo Gua de Referencia de StatTools describe los iconos,
comandos y funciones estadsticas que utiliza StatTools. Este captulo
est dividido en cuatro secciones:
1) Gua de referencia: Iconos de StatTools
2) Gua de referencia: Resumen de procedimientos de StatTools
3) Gua de referencia: Comandos de StatTools
4) Gua de referencia: Funciones de StatTools
Lenguaje de macros y kit para programadores de
StatTools
StatTools tambin incluye un eficaz lenguaje para macros basado en
VBA que se puede usar para:
1) Automatizar anlisis de StatTools
2) Desarrollar nuevos anlisis estadsticos que utilizan el
Administrador de Conjuntos de Datos, los informes y los
grficos de StatTools. Estos clculos personalizados pueden
proporcionar anlisis que no se encuentran entre los
procedimientos incorporados de StatTools. Si lo desea, estos
anlisis pueden aparecer en el men y en la barra de
herramientas de StatTools.
Para obtener informacin sobre el lenguaje para macros VBA y el kit
para programadores de StatTools, consulte la documentacin
electrnica que se suministra con el producto.


24



Gua de referencia: Iconos de StatTools 25

Gua de referencia: Iconos de
StatTools
La barra de herramientas de StatTools
Los iconos de StatTools se usan para definir conjuntos de datos y
variables y luego ejecutar procedimientos estadsticos de esas
variables. Los iconos de StatTools aparecen en la barra de
herramientas de Excel (como barra de herramientas personalizada de
Excel) en Excel 2003 y versiones anteriores y en una cinta en Excel
2007. Esta seccin describe brevemente cada icono, explicando las
funciones que realizan y los comandos de men equivalentes.
Los siguientes iconos aparecen en la barra de herramientas de
StatTools en Excel 2003.
Icono Funcin y comando equivalente


Define un conjunto de datos y variables, o edita y elimina
conjuntos de datos o variables existentes
Comando equivalente: Comando Administrador de conjunto de
datos


Ejecuta una utilidad de datos
Comando equivalente: Comando Utilidades de datos


Ejecuta un procedimiento estadstico de resumen
Comando equivalente: Comando Estadstica de Resumen


Crea grficos de resumen de variables
Comando equivalente: Comando Grfico de Resumen


Ejecuta un procedimiento de inferencia estadstica
Comando equivalente: Comando Inferencia estadstica


Ejecuta una prueba de normalidad de variables
Comando equivalente: Comando Pruebas de Normalidad

26 La barra de herramientas de StatTools



Ejecuta un procedimiento de series de tiempo o de
previsin
Comando equivalente: Comando Series de Tiempo y Previsin


Ejecuta un procedimiento de regresin o clasificacin
Comando equivalente: Comando Regresin o Clasificacin


Ejecuta un procedimiento de control de calidad
Comando equivalente: Comando Control de Calidad


Ejecuta una prueba no paramtrica
Comando equivalente: Comando Pruebas No Paramtricas


Muestra las Utilidades de StatTools
Comando equivalente: Comandos de Utilidades


Muestra el archivo de ayuda de StatTools
Comando equivalente: Comando Ayuda

Los siguientes iconos aparecen en la cinta de StatTools en Excel 2007.
Icono Funcin y comando equivalente

Define un conjunto de datos y variables, o edita y
elimina conjuntos de datos o variables existentes
Comando equivalente: Comando Administrador de
conjunto de datos

Ejecuta una utilidad de datos
Comando equivalente: Comando Utilidades de datos

Ejecuta un procedimiento estadstico de resumen
Comando equivalente: Comando Estadstica de Resumen

Crea grficos de resumen de variables
Comando equivalente: Comando Grfico de Resumen

Gua de referencia: Iconos de StatTools 27


Ejecuta un procedimiento de inferencia
estadstica
Comando equivalente: Comando Inferencia estadstica

Ejecuta una prueba de normalidad de variables
Comando equivalente: Comando Prueba de Normalidad

Ejecuta un procedimiento de series de tiempo o
de previsin
Comando equivalente: Comando Series de Tiempo y
Previsin

Ejecuta un procedimiento de regresin o
clasificacin
Comando equivalente: Comando Regresin o
Clasificacin

Ejecuta un procedimiento de control de calidad
Comando equivalente: Comando Control de Calidad

Ejecuta una prueba no paramtrica
Comando equivalente: Comando Pruebas No
Paramtricas

Muestra las Utilidades de StatTools
Comando equivalente: Comandos de Utilidades

Muestra el archivo de ayuda de StatTools
Comando equivalente: Comando Ayuda

28



Gua de referencia: Comandos del men de StatTools 29

Gua de referencia: Comandos
del men de StatTools
Introduccin
Esta seccin de la Gua de referencia detalla los comandos disponibles
en StatTools tal y como aparecen en el men de StatTools de Excel
2003 o versiones anteriores, y en la cinta de StatTools en Excel 2007 y
versiones posteriores. Los comandos se describen en el orden en que
aparecen en el men, comenzando con el comando Administrador de
conjunto de datos y siguiendo hacia abajo en el men. Los iconos de
StatTools se pueden utilizar para ejecutar muchos de los comandos
del programa. En la seccin Gua de referencia: Iconos de StatTools
de este captulo se indican los comandos equivalentes a los iconos de
StatTools.
Tambin se puede acceder a varios comandos de grficos de
StatTools a travs de un men desplegable que aparece cuando se
pulsa el botn derecho del ratn en Excel.



30



Gua de referencia: Comandos del men de StatTools 31

Lista de comandos
Los procedimientos disponibles en StatTools se presentan en grupos
naturales. Por cada grupo hay un elemento en el men de StatTools.
Si un grupo tiene ms de un elemento, hay una lista de submen en
este grupo. Esta seccin proporciona una breve descripcin de cada
procedimiento de cada grupo. Se ofrece informacin ms detallada
sobre cada procedimiento en la seccin de este captulo titulada
Referencia: Comandos de StatTools.
Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
Estadsticas de resumen
El comando
Resumen de
una variable
Genera estadsticas de
resumen incluyendo
mediciones usuales como
promedio, mediana y
desviacin estndar,
adems de opciones como
cuartiles y percentiles.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-100
El comando
Correlacin y
covarianza
Crea una tabla de
correlaciones y /o
covarianzas para el
conjunto de variables
seleccionadas.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250
Grficos de resumen
El comando
Histograma
Crea un histograma de
cada variable seleccionada.
Le da la opcin de definir
las categoras o intervalos
del histograma.
Se permiten
al principio,
en el medio y
al final de los
datos
Parcialmente en
vivo: los
cambios de
datos actualizan
el grfico
cuando los
datos estn
dentro del rango
del eje X del
grfico
Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-100
El comando
Diagrama de
dispersin
Crea un diagrama de
dispersin para cada par de
variables seleccionadas.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Slo datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
1-10
El comando
Diagrama de
cajas-bigotes
Crea un solo diagrama de
cuadro (si se selecciona
una sola variable) o
diagramas de cuadro
paralelos (si se seleccionan
varias variables).
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
No Se
ignoran
1-10

32 Lista de comandos

Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
Inferencia estadstica
El comando
Intervalo de
confianza
Media/desviaci
n estndar
Calcula un intervalo de
confianza para la media y la
desviacin estndar de una
sola variable, o las
diferencias entre medias de
pares de variables. Los
intervalos de confianza se
pueden calcular con un
Anlisis de una muestra, un
Anlisis de dos muestras o
un Anlisis de Par de
Muestras.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)
El comando
Intervalo de
confianza
Proporcin
Analiza la proporcin de
elementos de una muestra
que pertenecen a una
categora determinada
(Anlisis de una muestra) o
compara dos muestras para
ver la proporcin de
elementos que tienen de
una categora determinada
(Anlisis de dos muestras).
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)
El comando
Prueba de
hiptesis
Media/desviaci
n estndar
Realiza pruebas de
hiptesis de la media y la
desviacin estndar de una
sola variable, o calcula las
diferencias entre medias de
pares de variables. Las
pruebas de hiptesis se
pueden hacer usando un
Anlisis de una muestra, un
Anlisis de dos muestras o
un Anlisis de Par de
Muestras.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)
El comando
Prueba de
hiptesis
Proporcin
Analiza la proporcin de
elementos de una muestra
que pertenecen a una
categora determinada
(Anlisis de una muestra) o
compara dos muestras para
ver la proporcin de
elementos que tienen de
una categora determinada
(Anlisis de dos muestras).
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)
El comando
Seleccin de
tamao de la
muestra
Determina el tamao de la
muestra (o tamaos de la
muestra) necesario para
obtener un intervalo de
confianza con una longitud
media. Lo hace para los
intervalos de confianza de
una media, una proporcin,
la diferencia entre las dos
medias y la diferencia entre
las dos proporciones.
n/a n/a n/a n/a n/a n/a

Gua de referencia: Comandos del men de StatTools 33

Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
El comando
ANOVA de una
direccin
Una extensin del anlisis
de dos muestras para
comparar las medias de
dos poblaciones. Prueba si
dos o ms medias son
iguales.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
2-50
El comando
ANOVA de dos
direcciones
Realiza un anlisis de dos
direcciones de la varianza.
Esto normalmente se hace
en el contexto de un diseo
experimental en el que hay
dos factores cada uno de
los cuales est establecido
en diferentes niveles de
tratamiento.
No permitido En vivo Datos
agrupados
Se permiten
hasta 16 m de
casos.
El experimento
debe ser
equilibrado
S No
permitido
2 variables de
categora, 1
variables de
valor
El comando
Prueba de
independencia
Chi-cuadrado
Usa una prueba chi-
cuadrado para comprobar
si los atributos de fila y
columna de una tabla de
contingencia son
estadsticamente
independientes.
No En vivo
(siempre que el
tamao de la
tabla no
cambie)
n/a n/a n/a n/a
Pruebas de normalidad
El comando
Prueba de
normalidad Chi-
cuadrado
Ejecuta una prueba chi-
cuadrado de normalidad de
cualquier variable
seleccionada.
Se permiten
al principio,
en el medio y
al final de los
datos
Parcialmente en
vivo (la posicin
de los intervalos
no cambia pero
la ocupacin y
los grficos s)
Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1
El comando
Prueba Lilliefors
Proporciona una prueba
ms eficaz de normalidad
que la prueba chi-cuadrada
de idoneidad de
adaptacin. (Ms eficaz
significa que es ms
probable que detecte la
falta de normalidad si
existe)
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-10
El comando
Diagrama
normal Q-Q
Crea un diagrama cuantil-
cuantil (Q-Q) de una
variable seleccionada.
Proporciona una prueba
informal de normalidad.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
No Se
ignoran
1
Series de Tiempo y Previsin
El comando
Grfico de
series de tiempo
Crea un diagrama de series
de tiempo de una o ms
variables de series de
tiempo, todas en la misma
grfica.
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
1-100

34 Lista de comandos

Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
El comando
Autocorrelacin
Calcula una cantidad
ilimitada de correlaciones
para una variables de
series de tiempo, indicando
cul (si alguna de ellas) da
un resultado no-cero
significativo, y proporciona
(opcionalmente) una grfica
de barras (denominada
correlograma) de las
autocorrelaciones.
Se permiten
al principio y
al final de los
datos
En vivo Datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
1-10
El comando
Prueba de
ejecuciones
para
aleatoriedad
Realiza una prueba de
ejecuciones para
comprobar si una variable
(normalmente una variable
de series de tiempo) es
aleatoria.
Se permiten
al principio y
al final de los
datos
En vivo Datos
desagrupados
Se permiten
hasta 16 m de
casos.
S No
permitido
1 o ms
El comando
Previsin
Hace una previsin de
datos de series de tiempo
usando el mtodo de
promedios en movimiento,
suavizacin exponencial
simple, el mtodo de
suavizacin exponencial de
Holt para capturar
tendencias, y el mtodo de
suavizacin exponencial de
Winters para capturar
estacionalidad.
Se permiten
slo al
principio de
los datos
En vivo Datos
desagrupados
Se permiten
hasta 32,000
casos.
S No
permitido
1 o ms
Regresin y clasificacin
El comando
Regresin
Ejecuta una variedad de
anlisis de regresin que
incluyen simple, mltiple,
por pasos, de avance, de
retroceso y de bloque.
Se permiten
al principio,
en el medio y
al final de los
datos
Esttico Datos
agrupados
Se permiten
hasta 16 m de
casos.
S No
permitido
1 dependiente;
1-250
independientes
El comando
Regresin
logstica
Realiza un anlisis de
regresin logstica de un
conjunto de datos. Se trata
bsicamente de un anlisis
de regresin de tipo no
lineal en el que la variable
de respuesta es binaria: 0 o
1.
Se permiten
al principio,
en el medio y
al final de los
datos
Esttico Datos
agrupados
Se permiten
hasta 16 m de
casos.
S No
permitido
1 dependiente;
1-250
independientes
El comando
Anlisis
discriminatorio
Realiza un anlisis
discriminatorio de un
conjunto de datos. Debe
haber una variable de
categora que especifique
en cul de dos o ms
grupos se encuentra cada
observacin, adems de
una o ms variables
explicatorias que se pueden
usar para predecir la
pertenencia a un grupo.
Se permiten
al principio,
en el medio y
al final de los
datos
Esttico Datos
desagrupados
Se permiten
hasta 16 m de
casos.
S No se
permiten
excepto
en
variables
indepen
dientes
1 dependiente;
1-250
independientes

Gua de referencia: Comandos del men de StatTools 35

Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
Control de calidad
El comando
Grfica de
Pareto
Produce una grfica de
Pareto que permite ver la
importancia relativa de
datos categorizados.
Se permiten
al principio,
en el medio y
al final de los
datos
Esttico Datos
desagrupados
S Se
ignoran
1 categora, o
1 valor y
1 categora
El comando
Grficas X/R
Produce grficas X y R que
permiten ver si un proceso
est bajo control
estadstico.
No permitido Esttico Datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
2-25
El comando
Grfica P
Produce grficas P que
permiten ver si un proceso
est bajo control
estadstico.
No permitido Esttico Datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
1 variable
1 variable de
tamao
El comando
Grfica C
Produce grficas C que
permiten ver si un proceso
est bajo control
estadstico.
No permitido Esttico Datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
1
El comando
Grfica U
Produce grficas U que
permiten ver si un proceso
est bajo control
estadstico.
No permitido Esttico Datos
desagrupados
Se permiten
hasta 32,000
casos.
No No
permitido
1
Pruebas no paramtricas
El comando
Prueba del
signo
Realiza pruebas de
hiptesis de la mediana de
una sola variable o de la
mediana de las diferencias
de un par de variables
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)
El comando
Prueba de los
signos de
Wilcoxon
Realiza pruebas de
hiptesis como lo hace la
prueba de signos, pero
presuponiendo que la
distribucin de probabilidad
es simtrica
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)
El comando
Prueba de
Mann-Whitney
Realiza una prueba de
hiptesis de dos muestras
Se permiten
al principio,
en el medio y
al final de los
datos
En vivo Datos
agrupados y
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-250 (anlisis
de una
muestra)
Exactamente 2
(anlisis de
dos muestras y
anlisis de par
de muestras)

36 Lista de comandos

Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
Utilidades de datos
El comando
Agrupar
Permite tomar un conjunto
de datos con variables
separadas en columnas
separadas para cada
grupo, y agruparlas en
dos columnas: una columna
de categora y una
columna de valor.
Dependiendo del tipo de
anlisis, el conjunto de
datos agrupados puede ser
ms fcil de usar que la
versin desagrupada.
S en
cualquier
lugar de la
variable
Esttico Slo datos
desagrupados
Se permiten
hasta 65535
casos.
No n/a 1-100
El comando
Desagrupar
Hace lo contrario que el
procedimiento de Agrupar.
S en
cualquier
lugar de la
variable
n/a Slo datos
agrupados
Se permiten
hasta 16 m de
casos.
S n/a 1-32
El comando
Transformar
Crea variables falsas (0-1)
basndose en variables
existentes.
S en
cualquier
lugar de la
variable
En vivo Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S n/a 1
El comando
Retrasar
Crea una nueva variable a
partir de un par de variables
numricas, una variable de
categora y otra numrica o
dos variables de categora
S en
cualquier
lugar de la
variable
En vivo Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S No
permitido
2-32 del
mismo
conjunto de
datos
El comando
Diferencia
Crea una nueva variable
tomando el producto, suma,
promedio, mnimo, mximo
o rango mn-mx de una o
ms variables.
S en
cualquier
lugar de la
variable
En vivo Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S n/a 2 variables de
valor, o
1 variable de
valor y 1
variable de
categora, o
2 variables de
categora
El comando
Interaccin
Crea una nueva variable
retrasada basndose en
una variable existente. Una
variable retrasada es
simplemente una versin
de la variable original,
desplazada hacia abajo
un nmero de filas igual al
retraso.
S en
cualquier
lugar de la
variable
En vivo Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1
El comando
Combinacin
Aplica cualquiera de las
cuatro transformaciones no
lineales a una variable
seleccionada logaritmo
natural, cuadrado, raz
cuadrada o recproca- para
crear una nueva variable
S en
cualquier
lugar de la
variable
En vivo o
estticos
Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-100

Gua de referencia: Comandos del men de StatTools 37

Procedimiento Descripcin Datos que
faltan?
Informes en
vivo o
estticos
Requisitos de
datos
Datos
multi-
rango?
Datos
no
vlidos
Nm. de
variables
El comando
Falso
Crea un nmero ilimitado
de variables de diferencia a
partir de una variable
original.
S en
cualquier
lugar de la
variable
En vivo Slo datos
desagrupados
Se permiten
hasta 16 m de
casos.
S n/a 1
El comando
Muestra
aleatoria
Permite generar un nmero
ilimitado de muestras
aleatorias a partir de un
conjunto de datos
determinado, con un
muestreo que puede ser
con o sin reemplazo.
S en
cualquier
lugar de la
variable
Esttico Slo datos
agrupados
Se permiten
hasta 16 m de
casos.
S Se
ignoran
1-32



38



Gua de referencia: Comandos del men de StatTools 39

El men de StatTools Conjunto de datos
El comando Administrador de conjunto de datos
Define conjuntos de datos y variables de StatTools, o edita y
elimina conjuntos de datos o variables existentes
El Administrador de conjunto de datos de permite definir los
conjuntos de datos y las variables. Una vez definidos los conjuntos de
datos y las variables, se pueden analizar con procedimientos de
StatTools. El cuadro de dilogo Administrador de conjunto de datos
permite aadir o quitar conjuntos de datos, poner nombre a un
conjunto de datos, especificar el diseo de las variables de un
conjunto de datos y poner nombre a las variables de un conjunto de
datos.
StatTools es similar a la mayora de los programas estadsticos de
funcionamiento independiente en el sentido de que est estructurado
alrededor de las variables. En la mayora de los anlisis se trabaja con
un conjunto de datos, o conjunto de variables estadsticas, que
normalmente se encuentran en columnas contiguas con los nombres
de las variables en la primera fila del conjunto de datos. Luego podr
usar estas variables predefinidas cuando ejecute anlisis estadsticos,
sin tener que seleccionar una y otra vez los datos que desea analizar.
Cada variable del conjunto de datos tiene asociado un nombre y un
rango de celdas de Excel. El Diseo seleccionado especifica cmo se
ubican las variables dentro de un conjunto de datos. Un diseo tpico
de variable es el de Columnas, con una variable por columna, pero las
variables tambin se pueden distribuir en Filas. Un conjunto de datos
puede incluir mltiples bloques de celdas, lo cual permite poner los
datos en diferentes hojas de un mismo libro de trabajo.
Cuando se definen conjuntos de datos, StatTools trata de identificar
las variables en el bloque de celdas que rodean a la seleccin actual de
Excel. Esto puede facilitar la configuracin del conjunto de datos con
nombres de variable en la fila superior y las variables distribuidas en
columnas.
La longitud de las columnas del conjunto de datos no tiene que ser
igual necesariamente. Por ejemplo, puede tener dos variables,
Peso_Hombres y Peso_Mujeres, con un nmero diferente de
observaciones. Sin embargo, en muchos anlisis, StatTools trata las
celdas en blanco de la columna ms corta como datos que faltan.
Qu son
conjuntos de
datos y variables?

40 El men de StatTools Conjunto de datos


Las opciones de Conjunto de datos del cuadro de dilogo
Administrador de conjunto de datos son:
Nuevo, Eliminar Aade un nuevo conjunto de datos o
elimina uno existente.
Nombre Especifica el nombre del conjunto de datos.
Rango de Excel Especifica el Rango de Excel asociado con el
conjunto de datos. Si se han asignado mltiples rangos de
celda al conjunto de datos, esta opcin va precedida de la
palabra Mltiple.
Aplicar formato de celda Aade una cuadrcula y colores
que identifican los conjuntos de datos.
Mltiple Haga clic en el botn Mltiple en el cuadro de
dilogo Administrador de conjunto de datos para abrir el
cuadro de dilogo Selector de rango mltiple. Este cuadro de
dilogo permite la introduccin de los rangos de celda
individuales que componen el conjunto de datos de mltiples
rangos de celda.
El cuadro de
dilogo
Administrador de
conjunto de datos

Gua de referencia: Comandos del men de StatTools 41

StatTools permite asignar mltiples rangos de celda a un solo
conjunto de datos. Se puede usar un conjunto de datos de mltiples
rangos cuando:
1) Cada variable del conjunto de datos tiene ms de 65536 puntos
de datos (en Excel 2003 o versiones anteriores), lo cual requiere
que el conjunto de datos se extienda a mltiples hojas de clculo
de un mismo libro de trabajo,
2) Los datos de una variable se encuentran en mltiples bloques
dispersados por las hojas de clculo del libro de trabajo.

Las opciones del cuadro de dilogo Selector de rango mltiple son:
Borra todos Borra todos los rangos introducidos.
Llenar auto Aplica el primer rango introducido (en la fila 1)
a todas las hojas de clculo visibles del libro de trabajo activo,
e introduce estas referencias de NombreDeHoja!RangoDeCeldas
en la cuadrcula
Seleccionar Muestra un selector para destacar el bloque de
celdas que se usar como Rango del Conjunto de Datos.
Los rangos secundarios tienen nombres de variables en la
primera columna (fila) Los conjuntos de datos de mltiples
rangos pueden tener nombres de variables identificando cada
columna (o fila, dependiendo del diseo de variable
seleccionado) de cada rango incluido en el cuadro de dilogo,
o nombres de variables identificando la columna o la fila slo
en el primer rango seleccionado. El primer rango seleccionado
es el rango introducido en la fila 1 del cuadro de dilogo
Selector de rango mltiple.
Conjuntos de
datos de rango
mltiple

42 El men de StatTools Conjunto de datos

Las opciones de Variables del cuadro de dilogo Administrador
de conjunto de datos son:
Diseo Especifica cmo se estructuran las variables en el
rango de Excel que contiene el conjunto de datos. Las
opciones de Diseo son:
- Columnas. Este es el diseo tpico en el que cada
columna del rango de Excel del conjunto de datos
contiene los datos de la variable. Frecuentemente, los
nombres de las variables se introducirn en la parte
superior de cada columna.

- Filas. Con este diseo, cada fila del conjunto de datos
contiene los datos de una variable. Este diseo se usa
normalmente para datos de series de tiempo en Excel.

Nombres en la primera columna (o fila) Seleccione esta
opcin cuando los nombres de las variables de un conjunto de
datos estn en las celdas de la parte superior de las columnas
(o en las celdas del extremo izquierdo cuando el diseo de
variable sea Filas).

Gua de referencia: Comandos del men de StatTools 43

Cada fila de la cuadrcula del cuadro de dilogo Administrador de
conjunto de datos contiene las variables de un conjunto de datos,
incluyendo nombre de cada variable, el rango de Excel que contiene
los puntos de datos de la variable, y el nombre del rango de Excel que
se usa para identificar los datos de la variable en las frmulas de
Excel.
Nombre de rango de Excel El nombre del rango que
aparece se utilizar en las frmulas de Excel que se crean en
los informes y grficos de StatTools. Estas frmulas permiten
que los informes sean en vivo; es decir, que se actualicen
automticamente cuando cambian los datos de la variable.
Los nombres de rango comprensibles ayudan a que las
frmulas resulten ms legibles.
Formato de salida Especifica el formato de los valores de
una variable en los informes de los anlisis de StatTools. La
opcin Automtico especifica que StatTools selecciona el
mejor formato basndose en el formato numrico aplicado
a las celdas que contienen los valores de las variables en
Excel. Haciendo clic en la flecha situada junto a la opcin
Formato de Salida, tambin puede seleccionar un formato
especfico:

General es equivalente al formato numrico General de Excel. Fijo
muestra el nmero introducido de Dgitos decimales. Moneda es
equivalente al formato numrico Moneda de Excel, y muestra el
nmero introducido de Dgitos decimales.
Nota: El formato de salida deseado tambin se puede introducir
directamente en el cuadro de dilogo Administrador de conjunto de
datos, usando la anotacin Formato Seleccionado(NmDgitosDecimales),
como Moneda(4).
Opciones de
variables

44 El men de StatTools Conjunto de datos

En una sola sesin, StatTools permite usar:
Hasta 256 conjuntos de datos, ubicados en un solo libro de
trabajo.
Hasta 256 variables por conjunto de datos. Todos los datos de
un solo conjunto de datos debe estar en el mismo libro de
trabajo.
Hasta 16,777,216 puntos de datos por variable.
Las capacidades reales de datos pueden ser menores que las indicadas
dependiendo de la configuracin del sistema y de la versin de Excel
que utilice. Hay anlisis especficos de StatTools que pueden tener
limitaciones diferentes. La capacidad de datos tambin se puede ver
afectada por las limitaciones de memoria del propio Excel.
Nota: El cuadro de dilogo Administrador de conjunto de datos
indica todos los conjuntos de datos y variables del libro de trabajo
activo (es decir, del libro de trabajo que se indica en el nombre del
cuadro de dilogo Administrador de conjunto de datos). Para ver
conjuntos de datos de otros libros de trabajo, active el libro de
trabajo deseado en Excel y abra el cuadro de dilogo Administrador
de conjunto de datos.


Capacidad de
conjuntos de
datos y variables

Gua de referencia: Comandos del men de StatTools 45

El men Utilidades de datos
El comando Agrupar
Convierte un conjunto de variables de formato desagrupado a
formato agrupado
El comando Agrupar permite convertir datos del formato
desagrupado, en el que el conjunto de datos contiene al menos dos
variables de Valor, al formato agrupado, en el que el conjunto de
datos contiene una variable de categora y una variable de valor. Por
ejemplo, si comparamos ingresos medios de un hogar en diferentes
barrios, en formato desagrupado habra una variable (o columna)
separada Ingresos por cada barrio. Estas columnas no tienen que ser
de la misma longitud; es decir, cada barrio puede tener un tamao de
la muestra diferente. En formato agrupado, habra una variable de
valor Ingresos y una variable de categora Barrios indicando en qu
barrio se encuentra cada hogar.
Bsicamente, este procedimiento permite agrupar las variables en
dos columnas: una columna de valor, Ingresos, y una columna de
categora, Barrio. Dependiendo del tipo de anlisis, el conjunto de
datos agrupados puede ser ms fcil de usar que la versin
desagrupada.

46 El men Utilidades de datos


Variables
agrupadas y
desagrupadas

Gua de referencia: Comandos del men de StatTools 47

Las variables se agrupan usando el cuadro de dilogo Utilidad de
agrupamiento:

Se deben seleccionar al menos dos o ms variables para hacer un
agrupamiento. El conjunto de datos seleccionado se trata inicialmente
como datos desagrupados. Las variables pueden ser de conjuntos de
datos diferentes.
Las opciones del cuadro de dilogo Utilidad de agrupamiento son:
Nombre de variable agrupada Especifica el nombre de las
variables de categora y de valor que formarn el conjunto de
datos agrupado de dos variables. Estos nombres aparecern
en la parte superior de las columnas de las variables de
categora y de valor.
Cuando haga clic en Aceptar, las variables se agrupan y se crea un
nuevo conjunto de datos para los datos agrupados.
Las variables de Categora y de Valor son necesarias para crear un
conjunto de datos agrupados. La variable de Categora (a veces
conocida como la variable de cdigo) es simplemente un
identificador descriptivo de un conjunto relacionado de variables de
valor. La variable de Categora es normalmente una etiqueta de texto.
Por otra parte, las variables de valor (tambin conocidas como
variables de medicin), son variables numricas estndar que se
pueden analizar en procedimientos estadsticos.
Si un procedimiento de StatTools impone lmites al nmero de
variables a seleccionar para el anlisis, en formato agrupado ese lmite
se aplica al nmero de categoras de la variable Categora. En formato
agrupado, normalmente se selecciona una sola Categora y una sola
variable de Valor, especificando as mltiples variables para el
anlisis, cada una correspondiente a cada categora de la variable
Categora.
Cuadro de dilogo
Utilidad de
agrupamiento
Qu son
variables de
categora y de
valor?
Nmero de
variables para el
anlisis en
formato agrupado

48 El men Utilidades de datos

El comando Desagrupar
Convierte un conjunto de variables de formato agrupado a
formato desagrupado
El comando Desagrupar hace lo contrario que el comando Agrupar.
Por ejemplo, si empieza con una variable de categora Sexo y una
variable de valor Peso, este comando las desagrupa en dos columnas
separadas de Peso_Hombres y Peso_Mujeres.
Las variables se desagrupan usando el cuadro de dilogo Utilidad de
desagrupamiento:

El conjunto de datos seleccionado se trata inicialmente como datos
agrupados. Se deben seleccionar al menos dos o ms variables para
hacer un desagrupamiento. Una de estas variables se identifica como
variable de Categora (marcando Cat) y otra u otras variables se
identifican como variables de Valor (marcando Val). Las variables
pueden ser de conjuntos de datos diferentes.
Cuando haga clic en Aceptar, las variables se desagrupan y se crean
uno o ms conjuntos de datos nuevos para los datos desagrupados.
Cuadro de dilogo
Utilidad de
desagrupamiento

Gua de referencia: Comandos del men de StatTools 49

El comando Transformar
Transforma una o ms variables en nuevas variables y valores
basndose en la funcin de transformacin introducida
El comando Transformar permite transformar cualquier variable
mediante cuatro opciones de transformacin: logaritmo natural,
cuadrado, raz cuadrada o recproca. Adems, permite introducir una
frmula que se usar para calcular el valor de la variable
transformada.
Si faltan valores en la variable en la que se basa la variable
transformada, tambin faltarn los valores correspondientes en la
variable transformada.
Las variables se transforman usando el cuadro de dilogo Utilidad de
transformacin:

El conjunto de datos seleccionado es siempre de datos desagrupados.
Slo se pueden transformar variables de un solo conjunto de datos al
mismo tiempo.
Cuadro de dilogo
Utilidad de
transformacin

50 El men Utilidades de datos

Las opciones del cuadro de dilogo Utilidad de transformacin son:
Funcin Operacin matemtica que se realizar en cada
valor de las variables seleccionadas cuando se genere el
nuevo valor transformado. Las funciones de transformacin
incorporadas son el logaritmo natural, el cuadrado, la raz
cuadrada y el recproco. Tambin se puede introducir una
Frmula personalizada que calcula un nuevo valor de
variable besado en una expresin matemtica como la
siguiente:
(Variable*1.5)^2
Observe que en la ecuacin la palabra clave Variable se usa
como soporte del valor real de la variable que se va a
transformar.


El conjunto de
datos con las
nuevas variables
transformadas

Gua de referencia: Comandos del men de StatTools 51

El comando Retrasar
Crea una nueva variable retrasada basndose en una variable
existente
El comando Retrasar permite crear una nueva variable retrasada
basada en una variable existente. Una variable retrasada es
simplemente una versin de la variable original desplazada hacia
abajo un nmero de filas igual al retraso. Por ejemplo, la versin de
retraso 3 de las ventas de noviembre de 1998 son las ventas de tres
meses antes, en agosto de 1998.
Las variables se retrasan usando el cuadro de dilogo Utilidad de
retraso:

El conjunto de datos seleccionado es siempre de datos desagrupados.
Slo se puede retrasar una variable al mismo tiempo.
Las opciones del cuadro de dilogo Utilidad de retrasos son:
Nmero de retrasos Nmero de periodos de tiempo que se
retrasarn los valores cuando se cree la nueva variable. Se
crea una nueva variable por cada uno de los retraso hasta
alcanzar el nmero de retrasos introducido.
Cuadro de dilogo
Utilidad de
retrasos

52 El men Utilidades de datos


Variable retrasada
a la derecha del
conjunto de datos
fuente

Gua de referencia: Comandos del men de StatTools 53

El comando Diferencia
Crea un nmero ilimitado de variables de diferencia a partir de
una variable original
El comando Diferencia permite crear un nmero ilimitado de
variables de diferencia a partir de una variable original. Se utiliza
principalmente con variables de series de tiempo. Se selecciona la
variable a partir de la cual se va a calcular la diferencia junto con el
nmero de diferencias (normalmente 1 o 2). El procedimiento crea esa
cantidad de nuevas variables de diferencia. Cada variable de
diferencia contiene diferencias de la variable seleccionada. Por
ejemplo (para datos mensuales), el valor de diferencia de marzo de
1997 es el valor original de marzo de 1997 menos el valor original de
febrero de 1997. De forma similar, la segunda variable de diferencia
(si se solicita) contiene las diferencias de las primeras diferencias.
Las diferencias se usan normalmente en anlisis de series de tiempo
cuando la variable original no es estacionaria a lo largo del tiempo.
Por ejemplo, una serie de tiempo con una tendencia hacia arriba, no es
estacionaria. Las diferencias normalmente consiguen que sea
estacionaria. A veces, es til calcular una segunda diferencia, pero
este procedimiento es menos comn. Una tercera diferencia (o
diferencias ms all de la tercera) casi nunca es necesaria.
Las variables de diferencia se crean usando el cuadro de dilogo
Utilidad de diferencia:

El conjunto de datos seleccionado es siempre de datos desagrupados.
Slo se pueden usar una variable cada vez para crear variables de
diferencia.
Cuadro de dilogo
Utilidad de
diferencia

54 El men Utilidades de datos

Las opciones del cuadro de dilogo Utilidad de diferencia son:
Nmero de diferencias Nmero de diferencias que se van a
crear.


Conjunto de datos
con variable de
diferencia

Gua de referencia: Comandos del men de StatTools 55

El comando Interaccin
Crea una variable de interaccin a partir de una o ms variables
originales
El comando Interaccin permite crear una variable de interaccin a
partir de una o ms variables originales. Las variables de interaccin
se pueden crear usando dos variables numricas, una variable
numrica y otra de categora, y dos variables de categora.
Si ambas variables son numricas (no categricas), se crea su
producto. Si una variable es numrica y la otra es categrica, se crean
los productos de la variable numrica con cada valor falso
correspondiente a las categoras de la variable categrica. Por ltimo,
si ambas variables son categricas, se crean los productos de todos los
pares de valores falsos de las dos variables categricas.
Las variables de interaccin se crean usando el cuadro de dilogo
Utilidad de interaccin:

El conjunto de datos seleccionado es siempre de datos desagrupados.
Se pueden usar una o ms variable a la vez para crear variables de
interaccin.
Las opciones del cuadro de dilogo Utilidad de interaccin son:
Interaccin entre Selecciona el tipo de cada variable que se
va a seleccionar; Dos variables numricas, Una variable
numrica y una de categora o Dos variables de categora.
Cuadro de dilogo
Utilidad de
Interaccin

56 El men Utilidades de datos

Una variable de interaccin se forma a partir de dos variables que se
seleccionan en el cuadro de dilogo. Hay tres opciones bsicas para
estas dos variables. Primero, ambas pueden ser variables de
medicin numricas. La variable de interaccin es su producto.
Segundo, una variable puede ser una variable de medicin
numrica y la otra una variable de categora. StatTools crea
internamente variables falsas para cada categora de la variable
categrica y multiplica cada variable falsa por la variable numrica.
Tercero, ambas variables pueden ser variables categricas. StatTools
crea internamente variables falsas para cada categora de cada
variable categrica y multiplica cada valor falso de la primera por
cada valor falso de la segunda. Por ejemplo, si las dos variables
categricas tienen 2 y 5 categoras, respectivamente, StatTools crear
2x5=10 variables de interaccin.


Cmo se crea
una variable de
interaccin?
Conjunto de datos
con variable de
interaccin

Gua de referencia: Comandos del men de StatTools 57

El comando Combinacin
Crea una variable de combinacin a partir de una o ms
variables originales
El comando Combinacin permite crear una variable de interaccin a
partir de una o ms variables originales. Tomando el producto, suma,
promedio, mnimo, mximo o rango mn-mx de una o ms variables,
se crea una variable de combinacin.
Las variables de combinacin se crean usando el cuadro de dilogo
Utilidad de combinacin:

El conjunto de datos seleccionado es siempre de datos desagrupados.
Se pueden usar una o ms variable a la vez para crear variables de
combinacin.
Las opciones del cuadro de dilogo Utilidad de combinacin son:
Opciones Operacin matemtica que se va a realizar en las
variables seleccionadas cuando se crea la variable de
interaccin. Puede ser un producto, suma, promedio, mn,
mx o rango mn-mx.

Cuadro de dilogo
Utilidad de
combinacin

58 El men Utilidades de datos


Conjunto de datos
con variable de
combinacin

Gua de referencia: Comandos del men de StatTools 59

El comando Falso
Crea variables falsas (0-1) basndose en variables existentes
El comando Falso crea variables falsas (0-1) basndose en variables
existentes. Hay dos opciones:
1) Puede crear una variable falsa para cada categora de una
variable categrica. Por ejemplo, si tiene una variable
categrica Origen (de automviles) con las categoras Estados
Unidos, Europa y Asia, se crean tres variables falsas con
nombre de variable Origin_EstadosUnidos, Origin_Europa y
Origin_Asia.
2) Puede crear una sola variable falsa a partir de una variable
numrica, basndose en un valor de corte seleccionado. Por
ejemplo, si tiene una variable Peso, se pueden crear variables
falsas para la condicin Peso <= 160. En este caso, se aadira
una nueva variable que tuviera el valor 0 cuando Peso > 160 y
1 cuando Peso <= 160.
Las variables falsas se crean usando el cuadro de dilogo Utilidad de
variable falsa:

Los datos seleccionados pueden ser agrupados o desagrupados. Slo
se pueden usar una variable al mismo tiempo para crear variables
falsas.
Cuadro de dilogo
Utilidad de
variable falsa

60 El men Utilidades de datos

Las opciones del cuadro de dilogo Utilidad de variable falsa son:
Opciones Selecciona la forma en que se crean las variables
falsas: 1) una variable falsa para cada categora distinta, o
2) una sola variable falsa a partir de la variable numrica. El
Valor de corte especifica el corte que se usar a la hora de
asignar una variable numrica a una variable falsa 0-1.


Conjunto de datos
con variable falsa

Gua de referencia: Comandos del men de StatTools 61

El comando Muestra aleatoria
Genera un nmero ilimitado de muestras aleatorias de las
variables seleccionadas
El comando Muestra aleatoria permite generar un nmero ilimitado
de muestras aleatorias de las variables seleccionadas. El usuario
puede especificar el nmero de muestras y el tamao de cada
muestra, y StatTools genera las muestras de las variables
seleccionadas. Se pueden muestrear mltiples variables dependiente o
independientemente, y el muestreo se puede hacer con o sin
reemplazo.
Las muestras aleatorias se generan usando el cuadro de dilogo
Utilidad de muestra aleatoria:

El conjunto de datos seleccionado es siempre de datos desagrupados.
Se pueden usar una o ms variable a la vez para generar muestras
aleatorias.
Cuadro de dilogo
de Utilidad de
muestra aleatoria

62 El men Utilidades de datos

Las opciones del cuadro de dilogo Utilidad de muestra aleatoria son:
Nmero de muestras y Tamao de la muestra. Se generar el
nmero seleccionado de muestras para cada variable
seleccionada, y cada muestra tendr un nmero de elementos
igual al tamao de la muestra indicado.
Muestra con reemplazo. Indica que un valor retrocede a la
poblacin original despus del muestreo, para permitir que
pueda ser muestreado de nuevo. De lo contrario, si no se
selecciona Muestra con reemplazo (es decir, se usa Muestra
Sin Reemplazo) no se genera un valor y no se puede
muestrear de nuevo.
Muestrear mltiples variables independientemente. Indica
que se hace una toma de muestras independiente para cada
valor muestreado de cada variable. De lo contrario, se usa
para todas las variables el mismo ndice de muestreo (un
nmero entre 1 y el nmero de valores de la variable).



Muestras
aleatorias
generadas

Gua de referencia: Comandos del men de StatTools 63

El men Estadstica de resumen
Los comandos del men Estadstica de resumen permiten calcular
varias medidas numricas de resumen para variables individuales o
para pares de variables. Recuerde que no hay tablas de contingencia
en los procedimientos de StatTools. Excel ya proporciona esta
capacidad en las tablas de pivote.
El comando Resumen de una variable
Calcula las estadsticas de resumen de las variables
El comando Resumen de una variable proporciona datos de resumen
para una cantidad ilimitada de variables numricas seleccionadas.
Estos datos incluyen la media, mediana, desviacin estndar,
varianza, mnimo, mximo, rango, primer cuantil, tercer cuantil,
rango intercuantil, desviacin absoluta de media, asimetra, curtosis,
cuenta, suma y percentiles seleccionados.
Este anlisis se configura usando el cuadro de dilogo Estadsticas de
resumen de una variable:

Se pueden seleccionar una o ms variables para su anlisis. Los datos
seleccionados pueden ser agrupados o desagrupados. Las variables
pueden ser de conjuntos de datos diferentes.
Cuadro de dilogo
Estadsticas de
resumen de una
variable

64 El men Estadstica de resumen

Las opciones del cuadro de dilogo Estadsticas de resumen de una
variable son:
Estadsticas de resumen del informe Selecciona las
estadsticas deseadas que se incluirn en el informe. Se
pueden aadir percentiles escribiendo los valores deseados.
El informe Resumen de una variable usa las funciones Stat de
StatTools (como StatSkewness) para establecer enlaces activos de
datos. El informe se coloca en la ubicacin especificada usando el
comando Configuraciones.


Informe de
resumen de una
variable

Gua de referencia: Comandos del men de StatTools 65

Datos que faltan Este procedimiento permite procesar datos
que faltan por caso. Es decir, en cada variable, los datos que
faltan en esa variable se ignoran cuando se calculan las
mediciones de resumen. (Este es el mtodo predeterminado
de Excel. Por ejemplo, si usa la funcin AVERAGE en un
rango, se promedian slo los valores numricos del rango).
Enlace a datos Todas las mediciones de resumen se calculan
segn las frmulas enlazadas a los datos. Por lo tanto, si
cambia cualquier dato, las mediciones de resumen cambian
automticamente.
Datos que faltan y
enlace a datos

66 El men Estadstica de resumen

El comando Correlacin y covarianza
Produce una tabla de correlaciones o una tabla de covarianzas
entre variables
El comando Correlacin y covarianza produce una tabla de
correlaciones o covarianzas entre cualquier conjunto de variables
numricas seleccionadas. Como ambas tablas son simtricas (es decir,
la correlacin entre X e Y es la misma que la correlacin entre Y y X),
puede elegir que aparezcan (1) slo las correlaciones (o covarianzas)
por debajo de la lnea diagonal, (2) slo aquellas por encima de la
diagonal, o (3) por debajo y por encima de la diagonal.
Este anlisis se configura usando el cuadro de dilogo Correlacin y
covarianza:

Se deben seleccionar dos o ms variables para su anlisis. El conjunto
de datos seleccionado debe ser de datos desagrupados. Las variables
pueden ser de conjuntos de datos diferentes.
Cuadro de dilogo
Correlacin y
covarianza

Gua de referencia: Comandos del men de StatTools 67

Las opciones del cuadro de dilogo Correlacin y covarianza son :
Tablas a crear Selecciona la tabla de correlacin y /o
covarianza deseada
Estructura de tabla Especifica la estructura de la tabla que
se va a generar:
- Simtrica de correlaciones (o covarianzas) por debajo
y por encima de la diagonal
- Slo entradas por encima de la diagonal de
correlaciones (o covarianzas) por encima de la
diagonal
- Slo entradas por debajo de la diagonal de
correlaciones (o covarianzas) por debajo de la diagonal
El Informe de Correlacin y covarianza usa las funciones Stat de
StatTools (como StatCorrelationCoeff) para establecer enlaces activos
de datos. El informe se coloca en la ubicacin especificada usando el
comando Configuraciones.

Informe de
correlaciones y
covarianza

68 El men Estadstica de resumen

Datos que faltan Se permite el uso de datos que faltan y se
tratan por pares. Es decir, para obtener la correlacin (o
covarianza) entre cualquier par de variables, se ignoran todos
los casos con datos que faltan en cualquiera de las dos
variables.
Enlace a datos Las correlaciones y covarianzas se calculan
segn las frmulas enlazadas a los datos. Por lo tanto, si
cambia cualquier dato, estas mediciones de resumen se
actualizan automticamente.
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 69

El men Grficos de resumen
Los comandos del men Grficos de resumen permiten crear grficas
muy tiles para los anlisis estadsticos y que no se generan de forma
fcil (o no se pueden generar) con el asistente de grficos de Excel. Por
supuesto, la capacidad de generar grficos de Excel es extensa, por lo
tanto StatTools trata de no duplicar cosas que Excel hace bien.
El comando Histograma
Crea histogramas de variables
El comando Histograma crea un histograma de cada variable
seleccionada. Ofrece la opcin de definir las categoras del histograma
(normalmente denominadas intervalos) y las muestra claramente en
la grfica. Tambin crea una tabla de frecuencia en la que se basa cada
histograma.
Este tipo de grfico se configura en el cuadro de dilogo Histograma:

Se pueden seleccionar una o ms variables para el grfico. Los datos
seleccionados pueden ser agrupados o desagrupados. Las variables
pueden ser de conjuntos de datos diferentes.
Las opciones del cuadro de dilogo Histograma son:
Nmero de intervalos. Esta opcin establece el nmero de
intervalos del histograma que se calculan en el rango de un
grfico. El valor introducido debe estar en el rango del 1 al
200. La opcin Auto calcula el nmero ideal de intervalos que
se utilizarn para los datos segn un heurstico interno.
Cuadro de dilogo
Histograma

70 El men Grficos de resumen

Mnimo de histograma. Establece el valor mnimo en el que
comienzan los intervalos del histograma. La opcin Auto
indica que StatTools comenzar los intervalos del histograma
basndose en el mnimo de los datos del grfico.
Mximo de histograma. Establece el valor mximo en el que
terminan los intervalos del histograma. La opcin Auto indica
que StatTools terminar los intervalos del histograma
basndose en el mximo de los datos del grfico.
Eje X. Selecciona Categrico o Numrico. Un eje x categrico
simplemente identifica con una etiqueta cada intervalo en el
punto medio del intervalo. Un eje x numrico tiene mnimo y
mximo de eje x legible y se puede cambiar su escala
usando las opciones de escala estndar de Excel.
Eje Y. Selecciona la Frecuencia, Frecuencia relativa o
Densidad de probabilidad como unidad de medida del eje Y.
Frecuencia es el nmero real de observaciones en un
intervalo. Frecuencia relativa es la probabilidad de que se
produzca un valor del rango de un intervalo (observaciones
de un intervalo/observaciones totales). Densidad es el valor
de frecuencia relativa dividido por el ancho del intervalo,
asegurando que los valores del eje Y permanecen constantes
con el cambio del nmero de intervalos.

Gua de referencia: Comandos del men de StatTools 71



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Los histogramas estn parcialmente
enlazados a los datos. Cuando los datos cambian y los nuevos
valores se encuentran dentro del rango de los intervalos del
histograma original, el grfico se actualiza automticamente.
No se actualizan en el grfico los cambios de datos que
requieren un cambio de los intervalos .
Histograma de
una sola variable
Datos que faltan y
enlace a datos

72 El men Grficos de resumen

El comando Diagrama de dispersin
Crea diagramas de dispersin entre pares de variables
El comando Diagrama de dispersin crea un diagrama de dispersin
para cada par de variables seleccionadas. Los diagramas de dispersin
se pueden crear con la opcin Diagrama XY de Excel, pero Excel pone
automticamente la primera variable (la del extremo izquierdo) en el
eje horizontal, lo cual tal vez no sea lo deseado. StatTools permite
elegir las variables que se colocarn en el eje horizontal. Cada
diagrama de dispersin muestra la correlacin entre las dos variables
con el diagrama correspondiente.
Este tipo de grfico se configura en el cuadro de dilogo Diagrama de
dispersin:

Se pueden seleccionar dos o ms variables para el grfico. Es
necesario al menos una variable de eje X y una de eje Y. Si se
seleccionan ms de dos variables, se generan mltiples diagramas de
dispersin. El conjunto de datos seleccionado debe ser de datos
desagrupados. Las variables pueden ser de conjuntos de datos
diferentes.
Las opciones del cuadro de dilogo Diagrama de dispersin son:
Mostrar coeficiente de correlacin. Especifica que se muestre
el coeficiente de correlacin entre las variables del grfico
Tipo de grfica. Selecciona el tipo de grfico que se crear.
Las opciones son:
Grfica Simple XY simple. Genera los diagramas de
dispersin tpicos de Excel.
Cuadro de dilogo
Diagrama de
dispersin

Gua de referencia: Comandos del men de StatTools 73

Clasificacin por variable de categora. El color de los puntos
del diagrama de dispersin depende de las categoras a las
que pertenecen los puntos de datos, segn se especifica en la
variable de categora adicional.



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas con datos que falten en cualquier par
de cualquiera de las dos variables seleccionadas.
Enlace de datos Los diagramas de dispersin estn
enlazados a los datos originales. Si los datos cambian,
tambin lo hacen los diagramas de dispersin. Sin embargo,
tal vez sea necesario actualizar manualmente las escalas de
los ejes si los rangos de las variables seleccionadas cambian
significativamente.
Ejemplo de
diagrama de
dispersin
Datos que faltan y
enlace a datos

74 El men Grficos de resumen

El comando Diagrama de cajas-bigotes
Crea diagramas de cajas-bigotes de las variables
El comando Diagrama de cajas-bigotes crea un solo diagrama de
Cajas-Bigotes (si selecciona una sola variable) o diagramas de cajas-
bigotes paralelos (si selecciona varias variables). Tambin crea una
hoja que muestra las estadsticas de resumen (cuartiles, rango de
intercuartiles, etc.) que se usan para formar los diagramas de cajas-
bigotes.
Este tipo de grfico se configura en el cuadro de dilogo Diagrama de
cajas-bigotes:

Se pueden seleccionar una o ms variables para el grfico. Los datos
seleccionados pueden ser agrupados o desagrupados. Las variables
pueden ser de conjuntos de datos diferentes.
Las opciones del cuadro de dilogo Diagrama de cajas-bigotes son:
Incluir elementos de descripcin clave de diagrama.
Especifica que se muestre bajo el grfico una clave separada
de descripcin de elementos del diagrama.
Cuadro de dilogo
Diagrama de
cajas-bigotes

Gua de referencia: Comandos del men de StatTools 75



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas para el
diagrama en las que falten datos.
Enlace de datos Los diagramas de cajas-bigotes que se crean
estn enlazados a los datos originales; si los datos cambian,
tambin lo hacen los diagramas de cajas-bigotes. Sin embargo,
tal vez sea necesario actualizar manualmente las escalas de
los ejes si la escala de los datos cambia significativamente.
Ejemplo de
diagrama de
cajas-bigotes
Datos que faltan y
enlace a datos

76



Gua de referencia: Comandos del men de StatTools 77

El men Inferencia estadstica
Los comandos del men Inferencia estadstica realizan los anlisis de
inferencia estadstica ms comunes: intervalos de confianza y pruebas
de hiptesis, junto con ANOVA de una y de dos direcciones.
El comando Intervalo de confianza
Media/desviacin estndar
Calcula los intervalos de confianza de la media y la desviacin
estndar de las variables
El comando Intervalo de confianza Media/desviacin estndar
calcula un intervalo de confianza para la media y la desviacin
estndar de una sola variable, o las diferencias entre medias de pares
de variables. Los intervalos de confianza se pueden calcular con un
Anlisis de una muestra, un Anlisis de dos muestras o un Anlisis
de par de muestras.
Este anlisis se configura usando el cuadro de dilogo Intervalo de
confianza para la media / desviacin estndar:

El nmero de variables seleccionadas depende del tipo de anlisis que
se use. Un anlisis de una muestra requiere una o ms variables,
mientras que un anlisis de dos muestras y un anlisis de par de
muestras requieren dos variables. Los datos seleccionados pueden ser
agrupados o desagrupados. Las variables pueden ser de conjuntos de
datos diferentes.

Cuadro de dilogo
Intervalo de
confianza para
la media /
desviacin
estndar

78 El men Inferencia estadstica

Las opciones del cuadro de dilogo Intervalo de confianza para la
media / desviacin estndar son:
Tipo de anlisis. Selecciona el tipo de anlisis a realizar. Las
opciones son:
- Anlisis de una muestra. Calcula los intervalos de
confianza de una sola variable numrica.
- Anlisis de dos muestras. Calcula el intervalo de
confianza de la diferencia entre medias de dos
poblaciones independientes.
- Anlisis de par de muestras. Este es bsicamente el
mismo que el anlisis de dos muestras, pero resulta
ms apropiado cuando las dos variables estn
naturalmente emparejadas de algn modo.
Esencialmente, ejecuta un anlisis de una muestra
sobre las diferencias entre pares.
Intervalos de confianza a calcular. Especifica los intervalos
de confianza que se calcularn a partir de las variables
seleccionadas. Las opciones cambian segn el tipo de anlisis
seleccionado:
- Anlisis de una muestra. Selecciona el clculo de
intervalos de confianza de la media y /o desviacin
estndar, y el nivel de confianza (0 a 100%) de cada
uno.
- Anlisis de dos muestras o Anlisis de par de
muestras. Selecciona el clculo del intervalo de
confianza de la diferencia entre las medias de dos
variables, y especifica el nivel de confianza (de 0 a
100%) deseado.

Gua de referencia: Comandos del men de StatTools 79



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe de
intervalo de
confianza
Datos que faltan y
enlace a datos

80 El men Inferencia estadstica

El comando Intervalo de confianza Proporcin
Calcula los intervalos de confianza de proporciones
El comando Intervalo de confianza de Proporcin permite analizar la
proporcin de elementos de una muestra que pertenecen a una
categora determinada (Anlisis de una muestra) o comparar dos
muestras para ver la proporcin de elementos que tienen de una
categora determinada (Anlisis de dos muestras). Hay tres tipos de
datos a los que respalda este procedimiento: Muestra de poblacin,
Tabla de resumen con cuentas y Tabla de resumen con
proporciones.
Este anlisis se configura usando el cuadro de dilogo Intervalo de
confianza para la proporcin:

Cuadro de dilogo
Intervalo de
confianza para la
proporcin

Gua de referencia: Comandos del men de StatTools 81

El nmero de variables seleccionadas depende del tipo de anlisis que
se use. Un anlisis de Una muestra requiere una o ms muestras para
el anlisis; un anlisis de Dos muestras requiere dos muestras. Uno
selecciona las variables con informacin de muestra usando la
columna identificada con la etiqueta Ct (Cuenta), % (Proporcin) o la
columna sin etiqueta para el Tipo de datos Muestra de poblacin. (Si
los datos de Muestra de Poblacin son agrupados, las muestras se
seleccionan en las columnas identificadas con las etiquetas C1 y C2,
donde C1 contiene las categoras agrupadas). Si los datos estn en
formato de tabla con cuentas o proporciones, hay una columna
adicional Cat para seleccionar una variable con nombres de categora.
En el caso del Tipo de datos Muestra de poblacin, las variables
pueden venir de diferentes conjuntos de datos.
Las opciones del cuadro de dilogo Intervalo de confianza son:
Tipo de anlisis. Selecciona el tipo de anlisis a realizar. Las
opciones son:
- Anlisis de una muestra. Calcula los intervalos de
confianza de la proporcin de elementos de una
muestra que pertenece a una categora determinada.
- Anlisis de dos muestras. Calcula el intervalo de
confianza de dos muestras con respecto a la
proporcin de elementos que hay en una categora
determinada
Tipo de datos. Especifica el tipo de datos a analizar, que son
Muestra de poblacin, Tala de resumen con cuentas o Tabla
de resumen con proporciones.
Opciones. Las opciones disponibles cambian dependiendo
del Tipo de Anlisis y Tipo de datos. Las opciones son:
- Nivel de confianza. Selecciona el nivel de confianza
(de 0 a 100%) para el anlisis.
- Tamao de la primera muestra y tamao de la
segunda muestra. En caso del Tipo de datos de
Tabla de resumen con proporciones, selecciona el
tamao de la primera muestra y de la segunda
muestra (slo en los anlisis de dos muestras).

82 El men Inferencia estadstica



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe de
intervalo de
confianza
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 83

El comando Prueba de hiptesis
Media/desviacin estndar
Hace una prueba de hiptesis de la media y la desviacin
estndar de las variables
El comando Prueba de hiptesis Media/desviacin estndar realiza
pruebas de hiptesis para la media y la desviacin estndar de una
sola variable, o las diferencias entre medias de pares de variables. Las
pruebas de hiptesis se pueden hacer usando un Anlisis de una
muestra, un Anlisis de dos muestras o un Anlisis de Par de
Muestras.
Este anlisis se configura usando el cuadro de dilogo Prueba de
hiptesis de la media / desviacin estndar:

El nmero de variables seleccionadas depende del tipo de anlisis que
se use. Un anlisis de una muestra requiere una o ms variables,
mientras que un anlisis de dos muestras y un anlisis de par de
muestras requieren dos variables. Los datos seleccionados pueden ser
agrupados o desagrupados. Las variables pueden ser de conjuntos de
datos diferentes.

Cuadro de dilogo
Prueba de
hiptesis de
la media /
desviacin
estndar

84 El men Inferencia estadstica

Las opciones del cuadro de dilogo Prueba de hiptesis de la media /
desviacin estndar son:
Tipo de anlisis. Selecciona el tipo de anlisis a realizar. Las
opciones son:
- Anlisis de una muestra. Hace pruebas de hiptesis
de una sola variable numrica.
- Anlisis de dos muestras. Realiza pruebas de
hiptesis de la diferencia entre medias de dos
poblaciones independientes.
- Anlisis de par de muestras. Este es bsicamente el
mismo que el anlisis de dos muestras, pero resulta
ms apropiado cuando las dos variables estn
naturalmente emparejadas de algn modo.
Esencialmente, ejecuta un anlisis de una muestra
sobre las diferencias entre pares.
Pruebas de hiptesis a realizar. Especifica las pruebas de
hiptesis que se realizarn a partir de las variables
seleccionadas. Las opciones cambian segn el tipo de anlisis
seleccionado. Un Anlisis de una muestra selecciona pruebas
de hiptesis de la media y/o desviacin estndar. Un
Anlisis de dos muestras o un Anlisis de par de muestras
selecciona pruebas de hiptesis de la diferencia entre las
medias de dos variables. Las opciones para cada prueba de
hiptesis seleccionada son:
- Valor de hiptesis nulo, o el valor del parmetro de
la poblacin con una hiptesis nula.
- Tipo de hiptesis alternativa, o la alternativa al Valor
de Hiptesis Nulo que se evaluar en el anlisis. El
Tipo de hiptesis alternativa puede ser de una
opcin (es decir, mayor o menor que la hiptesis
nula) o de dos opciones (es decir, no igual a la
hiptesis nula).

Gua de referencia: Comandos del men de StatTools 85



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe Prueba
de hiptesis
Datos que faltan y
enlace a datos

86 El men Inferencia estadstica

El comando Prueba de hiptesis Proporcin
Realiza una prueba de hiptesis de proporciones
El comando Prueba de hiptesis Proporcin analiza la proporcin
de elementos de una muestra que pertenecen a una categora
determinada (Anlisis de una muestra) o compara dos muestras para
ver la proporcin de elementos que tienen de una categora
determinada (Anlisis de dos muestras). Hay tres tipos de datos a los
que respalda este procedimiento: Muestra de poblacin, Tabla de
resumen con cuentas y Tabla de resumen con proporciones.
Este anlisis se configura usando el cuadro de dilogo Prueba de
hiptesis para proporcin:

Cuadro de dilogo
Prueba de
hiptesis para
proporcin

Gua de referencia: Comandos del men de StatTools 87

El nmero de variables seleccionadas depende del tipo de anlisis que
se use. Un Anlisis de una muestra requiere una o ms muestras para
el anlisis; un Anlisis de dos muestras requiere dos muestras. Uno
selecciona las variables con informacin de muestra usando la
columna identificada con la etiqueta Ct (Cuenta), % (Proporcin) o la
columna sin etiqueta para el Tipo de datos Muestra de poblacin. (Si
los datos de Muestra de Poblacin son agrupados, las muestras se
seleccionan en las columnas identificadas con las etiquetas C1 y C2,
donde C1 contiene las categoras agrupadas). Si los datos estn en
formato de tabla con cuentas o proporciones, hay una columna
adicional Cat para seleccionar una variable con nombres de categora.
En el caso del Tipo de datos Muestra de poblacin, las variables
pueden venir de diferentes conjuntos de datos.
Las opciones del cuadro de dilogo Prueba de hiptesis para
proporcin son:
Tipo de anlisis. Selecciona el tipo de anlisis a realizar. Las
opciones son:
- Anlisis de una muestra. Realiza un anlisis de
hiptesis de la proporcin de elementos de una
muestra que pertenece a una categora determinada.
- Anlisis de dos muestras. Realiza una prueba de
hiptesis de dos muestras con respecto a la
proporcin de elementos que hay en una categora
determinada
Tipo de datos. Especifica el tipo de datos a analizar, que son
Muestra de poblacin, Tala de resumen con cuentas o Tabla
de resumen con proporciones.
Pruebas de hiptesis a realizar. Especifica las pruebas de
hiptesis que se realizarn a partir de la proporcin
seleccionada. Las opciones cambian segn el tipo de anlisis
seleccionado. Las opciones son:
- Valor de hiptesis nulo, o el valor del parmetro de
la poblacin con una hiptesis nula.
- Tipo de hiptesis alternativa, o la alternativa al Valor
de Hiptesis Nulo que se evaluar en el anlisis. El
Tipo de Hiptesis Alternativa puede ser de una
opcin (es decir, mayor o menor que la hiptesis
nula) o de dos opciones (es decir, no igual a la
hiptesis nula).

88 El men Inferencia estadstica

Tamao de la primera muestra y tamao de la segunda
muestra. En caso del Tipo de datos de Tabla de resumen con
proporciones, selecciona el tamao de la primera muestra y de la
segunda muestra (slo en los anlisis de dos muestras).



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe Prueba
de hiptesis
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 89

El comando Seleccin de tamao de la muestra
Determina el tamao de la muestra necesario para calcular
intervalos de confianza
El comando Seleccin de tamao de la muestra determina el tamao
de la muestra (o tamaos de la muestra) necesario para obtener un
intervalo de confianza con una longitud media. Lo hace para los
intervalos de confianza de una media, una proporcin, la diferencia
entre las dos medias y la diferencia entre las dos proporciones. No es
necesario el uso de conjuntos de datos ni variables, ya que el tamao
de la muestra es informacin que normalmente se necesita antes de
recoger los datos. es necesario especificar el nivel de confianza, la
longitud media deseada y cualquier otro parmetro necesario para
determinar el tamao de la muestra.
Este anlisis se configura usando el cuadro de dilogo Seleccin de
tamao de la muestra:

Las opciones del cuadro de dilogo Seleccin de tamao de la
muestra son:
Parmetro a estimar Selecciona el tipo de parmetro que se
estimar a partir de la muestra (cuyo tamao est
determinando). Las opciones incluyen Media, Proporcin
(valores entre 0 y 1), Diferencias de medias y Diferencias de
proporciones.
Cuadro de dilogo
Seleccin de
tamao de la
muestra

90 El men Inferencia estadstica

Especificacin de intervalo de confianza Estas opciones
varan segn el Parmetro a Estimar seleccionado, como se
indica a continuacin:
- Cuando el Parmetro a estimar es Media y
Diferencia de medias. Primero, introduzca el Nivel
de confianza deseado (normalmente entre 90% y
100%), la Longitud media del intervalo (el
componente ms o menos del intervalo) y la
Desviacin estndar estimada de la poblacin. Nota:
El Nivel de Confianza y la Longitud del Intervalo
estn relacionados, ya que un nivel de confianza ms
alto requiere un intervalo de confianza de mayor
longitud.
- Cuando el Parmetro a Estimar es Proporcin y
Diferencia de proporciones. Primero, introduzca el
Nivel de confianza deseado (normalmente entre 90%
y 100%), la Longitud media del intervalo (el
componente ms o menos del intervalo) y la
Proporcin Estimada (un valor entre 0 y 1). Si va a
estimar la Diferencia de proporciones, proporcione
una Proporcin estimada para cada poblacin.



Datos que faltan No es relevante.
Enlace a datos No es relevante.
Informe Seleccin
de tamao de la
muestra
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 91

El comando ANOVA de una direccin
Realiza un anlisis ANOVA de una direccin de las variables
El comando ANOVA de una direccin es una generalizacin de
procedimiento de dos muestras para comparar las medias entre dos
poblaciones. Con el anlisis ANOVA de una direccin, se comparan
las medias de al menos dos (normalmente ms de dos) poblaciones.
Esto se hace con una tabla ANOVA (anlisis de varianza). Esta tabla
compara dos fuentes de variacin: la variacin dentro de cada
poblacin comparada con la variacin entre medias de muestras de
diferentes poblaciones. Si esta ltima variacin es grande con relacin
a la primera, segn la prueba F de medicin, entonces hay evidencia
de diferencias entre las medias de las poblaciones.
El valor clave de la tabla ANOVA es el valor p. Un valor p pequeo
evidencia medias de poblacin diferentes. Adems de la tabla
ANOVA, tambin ofrece informacin el examen de los intervalos de
confianza de todas las diferencias entre pares de medias. Los
intervalos de confianza que no incluyen 0 son evidencia de medias
que no son iguales. StatTools proporciona la opcin de varios tipos de
intervalos de confianza, cada uno basado en un mtodo ligeramente
diferente.
Este anlisis se configura usando el cuadro de dilogo ANOVA de
una direccin:

Cuadro de dilogo
ANOVA de una
direccin

92 El men Inferencia estadstica

Es necesario seleccionar dos o ms variables para su anlisis. Los
conjuntos de datos seleccionados pueden ser agrupados o
desagrupados. Las variables pueden ser de conjuntos de datos
diferentes.
Las opciones del cuadro de dilogo ANOVA de una direccin son:
Mtodos de intervalo de confianza Se selecciona uno o ms
de los siguientes mtodos para corregir intervalos de
confianza de variables individuales. Sin correccin, o no se
realiza la correccin, y los mtodos de correccin Bonferroni,
Tukey y Scheffe.
Nivel de confianza Este es un nivel de confianza
simultneo de los resultados de todas las variables. Es
decir, es la confianza que quiere tener de que todos los
intervalos de confianza contienen sus respectivas diferencias
de media de poblacin. Por razones tcnicas, el nivel de
confianza general real normalmente es menor que el nivel
especificado para los intervalos de confianza con no hay
correccin. Esta es la razn de ser de los mtodos de
correccin anteriores. Corrigen (expanden) las longitudes
de los intervalos de confianza de forma que el nivel de
confianza general es el especificado.

Gua de referencia: Comandos del men de StatTools 93


En este informe ANOVA de Una Direccin, las estadsticas de
resumen de cada poblacin (en este caso, de cada planta) aparecen en
la parte superior. Despus de las estadsticas de resumen, se incluye
una tabla de estadsticas de muestra de cada variable. La tabla
ANOVA aparece a continuacin. En este ejemplo, un valor p muy
pequeo indica sin lugar a dudas que las puntuaciones de la media de
las cinco plantas no son todas iguales. Para ver qu medias son
diferentes, se examinan los intervalos de confianza de la parte inferior
del informe. Los pares con valores en negrita tienen medias
significativamente diferentes.
Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe ANOVA
de una direccin
Datos que faltan y
enlace a datos

94 El men Inferencia estadstica

El comando ANOVA de dos direcciones
Realiza un anlisis ANOVA de dos direcciones de las variables
El comando ANOVA de dos direcciones realiza un anlisis de dos
direcciones de la varianza. Esto normalmente se hace en el contexto
de un diseo experimental en el que hay dos factores cada uno de
los cuales est establecido en diferentes niveles de tratamiento. Por
ejemplo, en un estudio de rendimiento de bolas de golf, los dos
factores pueden ser Marca y Temperatura exterior. Entonces, los niveles
de tratamiento de Marca seran de A a E, y los niveles de
tratamiento de Temperatura seran Fro, Templado y Calor. La
variable de valor sera Distancia recorrida y se recogeran
observaciones de una serie de bolas de cada una de las combinaciones
de Marca /Temperatura. El propsito del estudio es ver si hay
diferencias de media significativas entre las diferentes combinaciones
de nivel de tratamiento.
Los datos del anlisis ANOVA de dos direcciones deben tener un
formato agrupado. Es decir, debe haber dos variables de categora
(correspondientes a Marca y Temperatura exterior en el ejemplo
anterior) y debe haber una variable de valor (correspondiente a
Distancia recorrida). Adems, el conjunto de datos debe estar
equilibrado; es decir, que debe haber un nmero igual de
observaciones en cada una de las combinaciones de nivel de
tratamiento. Es posible analizar un diseo desequilibrado, pero este
diseo se analiza mejor con regresin (con variables falsas).
Este anlisis se configura usando el cuadro de dilogo ANOVA de
dos direcciones:

Deben seleccionarse dos variables de categora (C1 y C2) y una
variable de valor (Val) para su anlisis. El conjunto de datos
seleccionado debe ser de datos agrupados.
Cuadro de dilogo
ANOVA de dos
direcciones

Gua de referencia: Comandos del men de StatTools 95


Los tres elementos superiores son las mediciones de resumen
(tamaos de la muestra, medias de la muestra y desviaciones estndar
de la muestra) de las diferentes combinaciones de nivel de
tratamiento. La parte inferior de la salida muestra la tabla ANOVA.
En esta tabla hay tres valores p importantes: dos de los efectos
principales y uno de las interacciones. Los efectos principales
indican si hay diferencias de media significativas en los niveles de
alguno de los factores, promediadas con los niveles del otro factor.
Por ejemplo, el efecto principal Temperatura indica si los valores de
las celdas de B17 a D17 son significativamente diferentes. (Lo son,
como indica un valor p muy pequeo de Temperatura en la tabla
ANOVA).
Datos que faltan Debido al requisito de un diseo
equilibrado, no pueden faltar datos.
Enlace a datos Todas las frmulas ANOVA estn enlazadas
a los datos. Si los datos cambian, los resultados cambian
automticamente. El equilibrio del experimento se verifica
cuando se ejecuta el anlisis. Los cambios de los datos pueden
afectar al equilibrio y producir resultados no vlidos.
Informe ANOVA
de dos
direcciones
Datos que faltan y
enlace a datos

96 El men Inferencia estadstica

El comando Prueba de independencia Chi-
cuadrado
Hace una prueba de independencia entre los atributos de fila y
columna de una tabla de contingencia
El comando Prueba de Independencia Chi-cuadrado hace una prueba
de independencia entre los atributos de fila y columna de una tabla de
contingencia Por ejemplo, si la tabla de contingencia incluye cuentas
de personas en diferentes categoras de bebedores y fumadores, el
procedimiento prueba si el hbito de fumar es independiente del
hbito de beber. La tabla de contingencia (tambin denominada cross-
tabs) puede ser una tabla de pivote de Excel.
Este procedimiento es de alguna forma diferente a la mayora de los
procedimientos de StatTools. Para este anlisis, todo lo que se necesita
es una tabla de contingencia rectangular. Cada celda de esta tabla
debe ser una cuenta de observaciones de una combinacin particular
de fila /columna (no bebedores y muy fumadores, por ejemplo). La
tabla tiene etiquetas de fila y columna (encabezamientos) y /o totales
de fila y columna, pero estos no son necesarios y slo se usan para
clarificar los informes de StatTools.
Este anlisis se configura usando el cuadro de dilogo Prueba de
independencia Chi-cuadrado:

Las opciones del cuadro de dilogo Prueba de independencia Chi-
cuadrado son:
Encabezamientos y ttulos de filas y columnas Se
selecciona una o ms de las siguientes opciones: La tabla
incluye encabezamientos de filas y columnas o
encabezamientos en la columna situada ms a la izquierda y
ms arriba de la tabla, Ttulo de columnas o el ttulo que
quiera usar para representar las columnas de la tabla, Ttulo
de filas o el ttulo que quiera usar para representar las filas de
la tabla.
Cuadro de dilogo
Prueba de
Independencia
Chi-cuadrado

Gua de referencia: Comandos del men de StatTools 97


El informe anterior muestra el resultado bsico de la prueba, un valor
p. Si este valor p es pequeo (como sucede aqu) se puede concluir
que los atributos de fila y columna no son independientes. Podemos
estudiar los nmeros de esta hoja para entender mejor la relacin que
hay entre fumar y beber.
Datos que faltan No deben faltar datos en las celdas de la
tabla de contingencia.
Enlace de datos Las frmulas del informe de Prueba de
independencia Chi-cuadrado estn enlazados con los datos. Si
cambian las cuentas de la tabla de contingencia original, los
resultados de salida de esta hoja tambin cambian.
Informe de Prueba
de independencia
Chi-cuadrado
Datos que faltan y
enlace a datos

98



Gua de referencia: Comandos del men de StatTools 99

El men Pruebas de normalidad
Como muchos de los procedimientos estadsticos presuponen que el
conjunto de datos est normalmente distribuido, es til contar con
mtodos para comprobar esta presuposicin. StatTools proporciona
tres comprobaciones de uso comn que se describen en esta seccin.
El comando Prueba de normalidad Chi-cuadrado
Prueba si los datos observados de una variable estn
normalmente distribuidos
El procedimiento Prueba de normalidad Chi-cuadrado usa una
prueba chi-cuadrado de idoneidad de adaptacin para comprobar si
los datos observados de una variable especificada vienen de una
distribucin normal. Para hacerlo, crea un histograma de esta
variable, usando las categoras que se especifiquen, y superpone un
histograma de una distribucin normal sobre el histograma de los
datos. Si los dos histogramas tienen bsicamente la misma forma, no
se puede rechazar la hiptesis nula de una adaptacin normal.
La prueba formal se realiza comparando las cuentas observadas de las
diferentes categoras con las cuentas esperadas basadas en una
presuposicin de normalidad. En realidad, el procedimiento permite
comprobar la normalidad de varias variables (separadamente). Se crea
un histograma de cada variable que seleccione y se ejecuta la prueba
chi-cuadrado en cada una de ellas.
El nico requisito de la Prueba de normalidad Chi-cuadrado es que
debe haber al menos una variable numrica. A parte de esto, la
mayora de los analistas recomiendan que haya al menos 100
observaciones; cuantas ms, mejor.

100 El men Pruebas de normalidad

Este anlisis se configura usando el cuadro de dilogo Prueba de
normalidad Chi-cuadrado:

Se puede seleccionar una variable para la prueba. Los datos
seleccionados pueden ser agrupados o desagrupados.
Las opciones del cuadro de dilogo Prueba de normalidad Chi-
cuadrado son:
Nmero de intervalos - Especifica un nmero fijo de
intervalos o permite que el nmero de intervalos se calcule
automticamente.
Mnimo y Mximo - Auto especifica que el mnimo y el
mximo del grupo de datos se utilice para calcular el mnimo
y el mximo de intervalos iguales. Sin embargo, el primer y el
ltimo intervalo se pueden aadir usando las opciones
Extender al -infinito y Extender al +infinito. Si no se
selecciona Automtico, se puede introducir un valor Mnimo
y uno Mximo especfico para indicar dnde empezarn y
acabarn los intervalos. De esta forma puede especificar un
rango especfico en el que los intervalos se harn sin tener en
cuenta los valores mnimo y mximo del conjunto de datos.
Extender al infinito indica que el primer intervalo ir del
mnimo especificado hasta el -infinito. Todos los dems
intervalos son de igual longitud. En ciertas circunstancias,
esto mejora la prueba de los conjuntos de datos cuyos lmites
inferiores no se conocen.
Cuadro de dilogo
Prueba de
Normalidad Chi-
cuadrado

Gua de referencia: Comandos del men de StatTools 101

Extender al +infinito indica que el ltimo intervalo ir del
mximo especificado hasta el +infinito. Todos los dems
intervalos son de igual longitud. En ciertas circunstancias,
esto mejora la prueba de los conjuntos de datos cuyos lmites
superiores no se conocen.

Informe de Prueba
de normalidad
Chi-cuadrado

102 El men Pruebas de normalidad

Los resultados de la prueba se muestran en el informe anterior. El
valor p de 0.4776 es un buen indicador de que las cantidades estn
normalmente distribuidas. Tambin aparecen evidencias de esto en
los histogramas de la Figura 4 y en los datos de frecuencia. Sin
embargo, recuerde dos cosas. Primero, si hay pocas observaciones
(digamos, bastantes menos de 100), la prueba chi-cuadrado no es
buena para distinguir la normalidad de la no normalidad. El efecto es
que el valor p normalmente no es suficientemente pequeo para
rechazar la hiptesis de normalidad. Bsicamente, casi todo tiende a
parecer normal cuando los conjuntos de datos son pequeos. Por otro
lado, si el conjunto de datos es muy grande (digamos, varios cientos
de observaciones), entonces el valor p normalmente ser pequeo,
indicando que no hay normalidad. La razn es que con conjuntos de
datos grandes, cada hoyo de la curva probablemente crear un
valor p pequeo. En este caso, la prueba real es una prctica: Estos
histogramas son en la prctica realmente diferentes?
Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos el histograma y todas las frmulas de la
prueba estn enlazadas a los datos originales. Por lo tanto, si
los datos cambian, el histograma y los resultados de la prueba
cambian automticamente.
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 103

El comando Prueba Lilliefors
Prueba si los datos observados de una variable estn
normalmente distribuidos
El procedimiento de la Prueba Lilliefors proporciona una prueba ms
eficaz de normalidad que la ms familiar prueba chi-cuadrado de
idoneidad de adaptacin. (Ms eficaz significa que es ms probable
que detecte la falta de normalidad si existe) Se basa en una
comparacin de una funcin de distribucin acumulativa emprica
y una funcin de distribucin acumulativa normal, donde la funcin
de distribucin acumulativa muestra la probabilidad de que sea
menor o igual a un valor determinado.
La funcin de distribucin acumulativa emprica se basa en los datos.
Por ejemplo, si hay 100 observaciones y la dcimo tercera ms
pequea es 137, la funcin de distribucin acumulativa emprica,
evaluada en 137, es 0.13. La prueba de Lilliefors encuentra la mxima
distancia vertical entre la funcin de distribucin acumulativa
emprica y la normal, y compara este mximo con los valores
tabulados (que se basan en el tamao de la muestra). Si la distancia
vertical mxima observada es suficientemente grande, entonces hay
evidencia de que los datos no provienen de una distribucin normal.
Este anlisis se configura usando el cuadro de dilogo Prueba
Lilliefors de normalidad:

Se pueden seleccionar una o ms variables para la prueba . El
conjunto de datos seleccionado debe ser de datos desagrupados. Las
variables pueden ser de conjuntos de datos diferentes.

Cuadro de dilogo
Prueba Lilliefors

104 El men Pruebas de normalidad


Los resultados de la prueba se muestran en el informe anterior. No
hay valor p (como en la mayora de las pruebas de hiptesis), pero
vemos que la distancia vertical mxima es suficientemente grande
como para sembrar la duda sobre la presuposicin de normalidad.
Aparecen ms evidencias en la funcin de distribucin acumulativa
del grfico. En realidad, la adaptacin entre las dos curvas parece ser
bastante buena y puede ser suficiente en la prctica. Es decir,
podemos llegar a la conclusin de que estos datos son lo
suficientemente cercanos como para que estn normalmente
distribuidos en la prctica.
Informe Prueba
Lilliefors

Gua de referencia: Comandos del men de StatTools 105

Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Las Funciones de Distribucin Acumulativa
y todas las frmulas de la prueba estn enlazadas a los datos
originales. Por lo tanto, si los datos cambian, el grfico y los
resultados de la prueba cambian automticamente.
Datos que faltan y
enlace a datos

106 El men Pruebas de normalidad

El comando Diagrama normal Q-Q
Prueba si los datos observados de una variable estn
normalmente distribuidos
El comando Diagrama normal Q-Q crea un diagrama cuantil-cuantil
(Q-Q) de una sola variable. Proporciona una prueba informal de
normalidad. Aunque los detalles son en cierto modo complejos, el
objetivo es bastante simple: comparar los cuantiles (o percentiles) de
los datos con los cuantiles de una distribucin normal. Si los datos son
bsicamente normales, entonces los puntos del diagrama Q-Q debe
estar cercanos a una lnea de 45 grados. Sin embargo, la curvatura
obvia del diagrama es una indicacin de cierta falta de normalidad
(asimetra, por ejemplo).
Este anlisis se configura en el cuadro de dilogo Diagrama normal
Q-Q:

Se puede seleccionar una variable para el diagrama. El conjunto de
datos seleccionado debe ser de datos desagrupados.
Las opciones del cuadro de dilogo Diagrama normal Q-Q son:
Dibujar usando valor Q estandarizados Especifica el uso de
valores Q estandarizados, en lugar de datos Q-Q, en el eje Y del
grfico. Esto hace posible la comparacin de los valores del eje Y
entre diagramas normales Q-Q.
Cuadro de dilogo
Diagrama normal
Q-Q

Gua de referencia: Comandos del men de StatTools 107


Como se indica anteriormente, esta es una prueba informal de
normalidad. Resulta difcil determinar la cercana que el diagrama
debe tener con respecto a la lnea de 45 grados para aceptar la
presuposicin de normalidad. Normalmente, se busca una curvatura
obvia en el diagrama, y en este diagrama no aparece ninguna.
Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Los diagramas de todas las frmulas estn
enlazados a los datos originales. Por lo tanto, si los datos
cambian, el diagrama cambia automticamente.

Informe Diagrama
normal Q-Q
Datos que faltan y
enlace a datos

108



Gua de referencia: Comandos del men de StatTools 109

El men Series de tiempo y previsin
Los procedimientos del men Series de Tiempo y Previsin se refieren
a los anlisis de datos recogidos en diferentes momentos, y tienen
aplicaciones en previsin y control de calidad. Los mtodos de
previsin disponibles incluyen el mtodo de promedios en
movimiento, suavizacin exponencial simple, el mtodo de
suavizacin exponencial de Holt para capturar tendencias, y el
mtodo de suavizacin exponencial de Winters para capturar
estacionalidad.
El comando Grfico de series de tiempo
Crea grficos de series de tiempo de una variable
El comando Grfico de series de tiempo dibuja una o ms variables de
series de tiempo en un mismo grfico. Si se seleccionan dos variables,
tiene la opcin de usar la misma escala o escalas diferentes en el eje Y
de las dos variables. Esta segunda opcin es til cuando los rangos de
valores de las dos variables son considerablemente diferentes. Sin
embargo, si se dibujan ms de dos variables, todas deben compartir la
misma escala vertical.
Debe haber al menos una variable numrica en el conjunto de datos.
Tambin puede haber una variable de fecha, pero si se va a usar
como etiqueta del eje horizontal del grfico, debe seleccionarse como
variable de etiqueta.
Este tipo de grfico se configura en el cuadro de dilogo Grfico de
series de tiempo:

Cuadro de dilogo
Grfico de series
de tiempo

110 El men Series de tiempo y previsin

Se pueden seleccionar una o ms variables para el grfico. El conjunto
de datos seleccionado debe ser de datos desagrupados. Las variables
pueden ser de conjuntos de datos diferentes. La variable de Etiqueta
(casilla Et) aparece en el eje X.
Las opciones del cuadro de dilogo Grfico de series de tiempo son:
Dibujar todas las variables en un solo grfico. Selecciona la
opcin de dibujar todas las variables en un solo grfico.
Usar dos ejes Y. Selecciona la opcin de mostrar un eje Y
diferente para cada variable en los grficos de dos variables.
De este modo, las unidades y valores de cada variable se
pueden mostrar en el grfico.



Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace de datos Los grficos estn enlazados a los datos de
forma que si cambian los datos, el grfico se actualiza
automticamente.
Grfico de series
de tiempo de dos
variables
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 111

El comando Autocorrelacin
Calcula las autocorrelaciones de las variables
El comando Autocorrelacin calcula las autocorrelaciones de
cualquier variable numrica seleccionada. Normalmente, esta variable
ser una variable de series de tiempo, si bien StatTools har los
clculos para cualquier variable. Puede seleccionar el nmero de
correlaciones que quiera (es decir, el nmero de retrasos). Tambin
puede solicitar una grfica de las autocorrelaciones, denominada
correlograma. La salida mostrar cul de las correlaciones es
significativamente diferente de 0, si hay alguna.
Este tipo de grfico se configura en el cuadro de dilogo
Autocorrelacin:

Se pueden seleccionar una o ms variables para su anlisis. El
conjunto de datos seleccionado debe ser de datos desagrupados.
Las opciones del cuadro de dilogo Autocorrelacin son:
Nmero de retrasos. El nmero de periodos de tiempo a
retrasar cuando se calculan las autocorrelaciones. Si
selecciona Automtico, StatTools determina el nmero
apropiado de retrasos a probar. Si introduce un nmero
especfico de retrasos, el nmero mximo de retrasos que
puede solicitar es el 25% del nmero de observaciones en las
series. Por ejemplo, si tiene 80 valores mensuales, puede
solicitar hasta 20 retrasos.
Crear tabla de autocorrelacin. Crea una grfica de barras en
la que la altura de cada barra es igual a la autocorrelacin
correspondiente.
Cuadro de dilogo
Autocorrelacin

112 El men Series de tiempo y previsin


El informe de correlacin se muestra arriba. Por cada retraso aparece
la autocorrelacin correspondiente junto con un error estndar
apropiado.
Datos que faltan Este procedimiento permite que haya
datos que faltan al principio de las series de tiempo, pero no
en el medio o al final de las series.
Enlace de datos StatTools enlaza la salida a los datos. Por lo
tanto, si cambian los datos, las autocorrelaciones (y el
correlograma) cambian automticamente.
Informe de
Autocorrelacin
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 113

El comando Prueba de ejecuciones para
aleatoriedad
Realiza una prueba de ejecuciones para ver si una variable es
aleatoria
El comando Prueba de Ejecuciones para Aleatoriedad permite
comprobar la aleatoriedad de una secuencia de valores de una
variable, normalmente una variable de series de tiempo. Indica
cuntas ejecuciones hay en la secuencia, donde una ejecucin es un
nmero consecutivo de valores a un lado o al otro de un punto de
corte (como puede ser la media o la mediana de la secuencia). En una
secuencia aleatoria no se esperan ni un nmero insuficiente de
ejecuciones ni un exceso de ellas. La prueba de ejecuciones cuenta el
nmero de ejecuciones y luego genera un valor p de la prueba. Si este
valor p es pequeo, podemos concluir que la secuencia
probablemente no es aleatoria; es decir, hay demasiadas ejecuciones o
no hay suficientes.
Este anlisis se configura usando el cuadro de dilogo Prueba de
ejecuciones para aleatoriedad:

Se pueden seleccionar una o ms variables para su anlisis. El
conjunto de datos seleccionado debe ser de datos desagrupados. Las
variables pueden ser de conjuntos de datos diferentes.
Cuadro de dilogo
Prueba de
ejecuciones para
aleatoriedad

114 El men Series de tiempo y previsin

Las opciones del cuadro de dilogo Prueba de ejecuciones para
aleatoriedad son:
Valor de corte para definir ejecuciones Una prueba de
ejecuciones se basa siempre en las ejecuciones por encima o
por debajo del un Valor de corte. Este puede ser la Media de
las series, la Mediana de las series o cualquier otro Valor de
corte personalizado que quiera introducir.


El informe anterior muestra el nmero de ejecuciones y el nmero
esperado de ejecuciones bajo aleatoriedad E(R). Como 20 est
significativamente por debajo de 24.8333, estas series no son
totalmente aleatorias; es decir, las ventas no zigzaguean tanto como
lo haran unas series aleatorias.
Datos que faltan Este procedimiento permite que haya
datos que faltan al principio y al final de las series de tiempo,
pero no en el medio de las series.
Enlace de datos StatTools enlaza la salida a los datos. Por lo
tanto, si los datos cambian, los informes cambian
automticamente.

Informe Prueba de
ejecuciones para
aleatoriedad
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 115

El comando Previsin
Genera previsiones de variables de series de tiempo
El comando Previsin proporciona varios mtodos para la previsin
de variables de series de tiempo. Estos mtodos incluyen el mtodo de
movimiento de promedio, suavizacin exponencial simple, el mtodo
de suavizacin exponencial de Holt para capturar tendencias, y el
mtodo de suavizacin exponencial de Winters para capturar
estacionalidad. El comando Previsin tambin permite
desestacionalizar primero los datos usando el mtodo de relacin con
el movimiento de promedios y un modelo de temporalidad
multiplicativo. Luego, puede usar cualquiera de los mtodos de
previsin (siempre que no sea el mtodo de Winters) para hacer la
previsin de los datos desestacionalizados, y finalmente
reestacionalizar las previsiones para regresar a las unidades
originales.
Los informes de previsin incluyen una serie de columnas que
muestran los diferentes clculos (por ejemplo, los niveles y tendencias
uniformizados para el mtodo de Holt, los factores estacionales del
mtodo de relacin con el movimiento de promedios, etc.), las
previsiones y los errores de previsin. Tambin se incluyen las
mediciones de resumen (MAE, RMSE y MAPE) para controlar la
adaptacin del modelo a los datos observados. (Cuando se usan
mtodos de suavizacin exponencial, tiene la opcin de usar la
optimizacin para encontrar las constantes de suavizacin que
minimicen RMSE.)
Finalmente, se ofrecen varios diagramas de series de tiempo,
incluyendo un diagrama de las series originales, un diagrama de las
series con las previsiones superpuestas, y un diagrama de los errores
de previsin. En el caso de la desestacionalizacin, estn disponibles
estos diagramas para las series de tiempo originales y las series
desestacionalizadas.

116 El men Series de tiempo y previsin

Las previsiones se configuran usando el cuadro de dilogo Previsin:

Se puede seleccionar una variable para el anlisis. El conjunto de
datos seleccionado debe ser de datos desagrupados.
Las opciones de Configuraciones de previsin de este cuadro de
dilogo especifican el mtodo de previsin que se usa y las
configuraciones del mtodo seleccionado. Las opciones son:
Nmero de previsiones. Especifica el nmero de periodos futuros
para los que se debe hacer una previsin.
Nmero de descartadas. Especifica el nmero de observaciones a
descartar, o no usar, en el modelo de previsin. Puede
seleccionar el uso de todas las observaciones para estimar el
modelo de previsin (0 descartadas), o puede descartar una
cuantas para validacin. Luego, el modelo se estima a partir de las
observaciones no descartadas y se usa para la previsin con las
observaciones descartadas.
Optimizar parmetros (slo para mtodos de suavizacin
exponencial). Encuentra la constante de suavizacin que
minimiza la RMSE (del periodo no descartado). La optimizacin
requiere que los Parmetros que se muestran en el cuadro de
dilogo estn entre 0 y 1. Si edita los valores de los parmetros
directamente en el informe de Previsin, asegrese de que
introduce valores de este rango.
Cuadro de dilogo
Previsin
Cuadro de dilogo
Previsin
Configuraciones
de previsin

Gua de referencia: Comandos del men de StatTools 117

Desestacionalizar. Selecciona la desestacionalizacin de los datos
antes de la previsin. Con datos estacionalizados, es decir, datos
que se sospecha que tienen un patrn estacional, hay dos
opciones. Puede usar el mtodo de Winters, que trata la
estacionalidad directamente, o puede seleccionar esta opcin para
desestacionalizar primero los datos, usando el mtodo de relacin
con el movimiento de promedios para la desestacionalizacin.
Luego, se puede usar cualquier mtodo para hacer previsiones de
series desestacionalizadas.
Mtodo Selecciona el mtodo de previsin que se va a usar; que
son el mtodo de Movimiento de promedios o los mtodos de
suavizacin exponencial Simple, de Holt o de Winters.
Parmetros Especifica los parmetros que se van a usar para el
mtodo de previsin seleccionado:
- Extensin (slo para el mtodo Movimiento de Promedios), o
el nmero de observaciones consecutivas que se usa en cada
movimiento de promedio.
- Nivel (todos los mtodos de suavizacin exponencial), un
parmetro de suavizacin que puede tomar cualquier valor
entre 0 y 1 (el valor predeterminado es 0.1).
- Tendencia (mtodos de suavizacin exponencial de Holt y
Winter), un segundo parmetro de suavizacin que puede
tomar cualquier valor entre 0 y 1 (el valor predeterminado
es 0.1).
- Estacionalidad (slo para el mtodo de suavizacin
exponencial de Winter), un tercer parmetro de suavizacin
que puede tomar cualquier valor entre 0 y 1 (el valor
predeterminado es 0.1).
Nota: Si selecciona Optimizar parmetros, los parmetros Nivel,
Tendencia y Estacionalidad no se pueden establecer, ya que son los
parmetros cuyos valores se van a optimizar.

118 El men Series de tiempo y previsin

Las opciones de Escala de tiempo especifican las etiquetas de
sincronizacin y escala de tiempo de la variable analizada. Las
opciones son:
Periodo de estacin. Especifica el tipo de datos de series de
tiempo; pueden ser Anual, Trimestral, Mensual, Semanal,
Diario o Ninguno. Esto se usa para los datos estacionalizados
y para las etiquetas.
Estilo de etiqueta. Especifica cmo ser la etiqueta de la
escala de tiempo de cualquier grfico que se genere.
Etiqueta de inicio. Especifica la primera etiqueta de escala de
tiempo del grfico.
Las opciones de Grficos a mostrar especifica los grficos de
previsin que se generarn. Estos grficos son:
1) Sobreposicin de previsin, o grfico de series de tiempo
de los valores de los datos generados por la previsin
2) Series originales, o grfico de series de tiempo de los datos
reales
3) Errores de previsin, o el error entre la previsin y los
valores reales
4) Sobreposicin de previsin desestacionalizada, o grfico
de series de tiempo de los valores de los datos generados
por la previsin despus de desestacionalizar los datos
originales
5) Series originales desestacionalizadas, o grfico de series de
tiempo de los datos reales despus de su
desestacionalizacin
6) Errores de previsin desestacionalizada, o error entre la
previsin y los valores actuales despus de desestacionalizar
los datos originales
Cuadro de dilogo
Previsin Escala
de tiempo
Cuadro de dilogo
Previsin
Grficos a
mostrar

Gua de referencia: Comandos del men de StatTools 119



Datos que faltan Se permite que haya datos que faltan al
principio de las series de tiempo, pero no en el medio o al final.
Enlace de datos Debido a la necesidad de clculos
elaborados, las previsiones no estn enlazadas a los datos. Si
se hacen cambios en los datos originales, el procedimiento
debe ejecutarse de nuevo.

Ejemplo de
informe de
previsin
Datos que faltan y
enlace a datos

120



Gua de referencia: Comandos del men de StatTools 121

Men Regresin y clasificacin
Los comandos del men Regresin y clasificacin realizan anlisis de
regresin y clasificacin. Los anlisis de regresin disponibles son
simple, mltiple, por pasos, de avance, de retroceso y de bloque.
Otros anlisis disponibles en el men de Regresin y clasificacin son
el anlisis discriminatorio y la regresin logstica.
El comando Regresin
Ejecuta anlisis de regresin de un conjunto de variables
El comando Regresin ejecuta una variedad de anlisis de regresin
que incluyen simple, mltiple, por pasos, de avance, de retroceso y de
bloque. Los informes de cada anlisis incluyen mediciones de
resumen de cada ejecucin de la ecuacin de regresin, una tabla
ANOVA de cada regresin y una tabla de coeficientes de regresin
estimados, sus errores estndar, sus valores t, sus valores p, y sus
intervalos de confianza del 95% por cada regresin.
Adems, tiene la opcin de crear dos nuevas variables, los valores
adaptados y los residuales, y crear un nmero de diagramas de
dispersin de diagnstico.
Los tipos de regresin disponibles son Simple, Mltiple, Pasos,
Avance, Retroceso y Bloque. El procedimiento de regresin Simple
Mltiple crea una ecuacin de una vez usando las variables
explicatorias seleccionadas. Los otros procedimientos permiten que
las variables (o bloques de variables) entren o salgan de la ecuacin
secuencialmente. Ms concretamente, el procedimiento por pasos
permite que las variables entren de una en una. La siguiente variable
que entra es la que tiene una correlacin ms alta con la parte no
explicada de la variable de respuesta. Sin embargo, la opcin por
pasos tambin permite que las variables salgan despus de entrar si
dejan de contribuir significativamente. El procedimiento de avance es
igual que el procedimiento por pasos, pero no permite que las
variables salgan despus de entrar. El procedimiento de retroceso
comienza con todas las variables potencialmente explicatorias de la
ecuacin y luego las elimina de una en una si no contribuyen
significativamente. Por ltimo, el procedimiento en bloque permite
que los bloques de variables explicatorias entre o no entren en bloque
en un orden especfico. Si un bloque no es significativo y no entra,
entonces no se consideran los bloques posteriores para su entrada.

Tipos de regresin
disponibles

122 Men Regresin y clasificacin

Estos anlisis se configuran usando el cuadro de dilogo Regresin:

Debe seleccionarse una variable dependiente (D) y una o ms
variables independientes (I) para su anlisis excepto en el caso de la
regresin en bloque. En la regresin en Bloque, debe seleccionarse una
variable dependiente (D) y de uno a siete bloques (de B1 a B7). El
conjunto de datos seleccionado debe ser de datos desagrupados. Las
variables pueden ser de conjuntos de datos diferentes.
Las opciones del cuadro de dilogo Regresin son:
Tipo de regresin. Selecciona el tipo de regresin a realizar:
Simple, Mltiple, Pasos, Avance, Retroceso y Bloque.
Cuadro de dilogo
Regresin

Gua de referencia: Comandos del men de StatTools 123

La seccin Parmetros de regresin cambia con la seleccin del Tipo
de regresin. Las opciones son:
Usar valores P Afecta a la forma en que se aaden o se
quitan las variables de la ecuacin de regresin. Cuando se
selecciona, permite especificar un Valor P a introducir y/o
Valor P a dejar, dependiendo del mtodo de regresin que se
use. Cuanto ms bajo sea el valor p, ms significativa ser una
variable para entrar o salir de la ecuacin de regresin. Los
valores predeterminados que se muestran son normalmente
aceptables. Pero recuerde dos cosas. Primero, el valor P a
introducir no puede ser mayor que el valor P a dejar.
Segundo, para facilitar la entrada de las variables (y dificultar
su salida), use Valores P ms grandes. Para dificultar la entrada
de las variables (y facilitar su salida), use Valores P ms
pequeos. Los valores P tpicos se encuentran en el rango
de .01 a .1.
Usar valores F Como con los valores P, afecta a la forma en
que se aaden o se quitan las variables de la ecuacin de
regresin. Permite especificar un Valor F a introducir y/o
Valor F a dejar, dependiendo del mtodo de regresin que se
use. Los valores tpicos se encuentran en el rango de 2.5 a 4.
StatTools puede crear varios diagramas de dispersin opcionales,
como se muestra en las opciones de Grficos seleccionadas. Estas
opciones son:
Valores ajustados y valores Y reales
Valores ajustados y valores X
Residuales y valores ajustados
Residuales y valores X
Normalmente, los diagramas se usan en anlisis residuales para
comprobar si se han cumplido las presuposiciones de la regresin. El
diagrama ms til es probablemente el de residuales (del eje vertical)
en comparacin con los valores ajustados (o de prediccin) de la
variable de respuesta.

124 Men Regresin y clasificacin

Las Opciones avanzadas de una anlisis de regresin son:
Incluir informacin de paso detallada, que incluye en el
informe las estadsticas de r cuadrado y error estndar de la
variable independiente en cada paso intermedio de la
regresin.
Incluir prediccin, que permite generar los valores de
prediccin de la variable dependiente para los valores de la
variable independiente en un segundo conjunto de datos. Este
conjunto de datos de prediccin debe tener los mismos
nombres de variable que el conjunto de datos originales que
la regresin est analizando. Normalmente, en el conjunto de
datos de prediccin tendr grupos de valores de variables
independientes para los cuales desea predecir el valor de la
variable dependiente. La ecuacin de regresin calculada a
partir del primer conjunto de datos se usa para hacer las
predicciones. Los valores de prediccin de la variable
dependiente se introducen directamente en el conjunto de
datos de prediccin; llenando la columna (o fila) de la
variable dependiente con los valores de la prediccin. El
Nivel de confianza especifica los lmites inferior y superior
que se generarn para los valores de la prediccin.


Gua de referencia: Comandos del men de StatTools 125



Datos que faltan Si faltan valores, se ignora cualquier fila en
la que falte valor de cualquiera de las variables seleccionadas.
Enlace de datos No hay enlace con los datos originales. Si
cambian los datos, debe ejecutar el anlisis de nuevo.
Informe de
regresin por
pasos
Datos que faltan y
enlace a datos

126 Men Regresin y clasificacin

El comando Regresin logstica
Ejecuta un anlisis de regresin logstica de un conjunto de
variables
El comando Regresin logstica realiza un anlisis de regresin
logstica de un conjunto de variables. Se trata bsicamente de un
anlisis de regresin de tipo no lineal en el que la variable de
respuesta es binaria: 0 o 1. Debe haber una variable de respuesta 0-1
que especifique si cada observacin en satisfactoria o fallida,
adems de una o ms variables explicatorias que se pueden usar para
estimar la probabilidad de xito.
Una segunda opcin para la regresin logstica es tener una variable
de cuenta que especifique el nmero de pruebas observadas en
cada combinacin de variables explicatorias. Luego, la variable de
respuesta indica el nmero de pruebas que resultan en xito. El
resultado de la regresin logstica es una ecuacin de regresin
similar a una ecuacin regular de regresin mltiple. Sin embargo,
debe interpretarse de forma diferente, como se explica a continuacin.
El procedimiento de regresin logstica de StatTools depende de la
optimizacin para encontrar la ecuacin de regresin. Esta
optimizacin debe usar un algoritmo no lineal complejo, por lo que el
procedimiento puede durar bastante tiempo, dependiendo de la
velocidad de su PC.
Este anlisis se configura usando el cuadro de dilogo Regresin
logstica:

Cuadro de dilogo
Regresin
logstica

Gua de referencia: Comandos del men de StatTools 127

Para este anlisis debe seleccionarse una variable dependiente o de
respuesta (D) y una o ms variables independientes (I). Los datos
deben:
1) Estar en formato agrupado, y debe haber una variable de
respuesta 0-1 que especifique si cada observacin es un
xito o un fallo. Esto se conoce aqu como Muestras sin
variable de cuenta.
2) Tener una variable de cuenta y una variable de respuesta
de nmero entero. Esto se conoce aqu como Resumen de
muestras (con variable de cuenta).
Las variables pueden ser de conjuntos de datos diferentes. Si el Tipo
de Anlisis se establece en Resumen de muestras (con variable de
cuenta), debe seleccionarse una variable de cuenta adicional.
Las opciones del cuadro de dilogo Regresin logstica son:
Tipo de anlisis. Selecciona el tipo de regresin logstica a
realizar Muestras sin variable de cuenta o Resumen de
muestras (con variable de cuenta).
- Muestras sin variable de cuenta tiene una
variable de respuesta 0-1 que especifica si
cada observacin en satisfactoria o
fallida, adems de una o ms variables
explicatorias que se pueden usar para estimar
la probabilidad de xito.
- Resumen de muestras (con variable de
cuenta) tiene una variable de cuenta que
especifica el nmero de pruebas
observadas en cada combinacin de variables
explicatorias. Luego, la variable de respuesta
indica el nmero de pruebas que resultan en
xito. En este tipo de anlisis aparece una
columna C separada en el Selector de
Variable, que permite seleccionar una
variable de cuenta.
Incluir resumen de clasificacin con el informe de regresin.
Incluir resultados de clasificacin con el informe de
regresin.

128 Men Regresin y clasificacin

Incluir prediccin, que permite generar los valores de
prediccin de la variable dependiente para los valores de la
variable independiente en un segundo conjunto de datos. Este
conjunto de datos de prediccin debe tener los mismos
nombres de variable que el conjunto de datos originales que
la regresin est analizando. Normalmente, en el conjunto de
datos de prediccin tendr grupos de valores de variables
independientes para los cuales desea predecir el valor de la
variable dependiente. La ecuacin de regresin calculada a
partir del primer conjunto de datos se usa para hacer las
predicciones. Los valores de prediccin de la variable
dependiente se introducen directamente en el conjunto de
datos de prediccin; llenando la columna (o fila) de la
variable dependiente con los valores de la prediccin.


Informe de
regresin
logstica

Gua de referencia: Comandos del men de StatTools 129

El informe anterior incluye los datos originales adems de los datos
usados para la clasificacin. Las clasificaciones de prediccin, en la
columna E, se basan en si las probabilidades estimadas de xito, en
la columna D, estn por encima o por debajo del valor de corte de 0.5,
o 50%. El informe incluye estadsticas de resumen de la regresin (de
algn modo similar al R-cuadrado de la regresin mltiple),
informacin detallada de la ecuacin de regresin y resultados de
resumen del procedimiento de clasificacin. (Hay mltiples
comentarios de celda que le ayudarn a interpretar los resultados). En
este ejemplo vemos que 90.5% de las observaciones estn clasificadas
correctamente. Por supuesto, esperamos que este porcentaje sea lo
ms grande posible. Generalmente, la nica forma de mejorar los
resultados es usar ms (o mejores) variables explicatorias. Los valores
de la columna H Exp (Coef) se usan generalmente para interpretar la
ecuacin de regresin. Indican el cambio estimado de las
probabilidades de xito cuando cualquier variable explicatoria
aumenta en 1 unidad.
Datos que faltan Si faltan valores, se ignora cualquier fila en
la que falte valor de cualquiera de las variables seleccionadas.
Enlace de datos No hay enlace con los datos originales. Si
cambian los datos, debe ejecutar el anlisis de nuevo.
Datos que faltan y
enlace a datos

130 Men Regresin y clasificacin

El comando Anlisis discriminatorio
Ejecuta un anlisis discriminatorio de un conjunto de variables
El comando Anlisis discriminatorio realiza un anlisis
discriminatorio de un conjunto de datos. En este anlisis hay una
variable de categora que especifica en cul de dos o ms grupos se
encuentra una observacin, adems de una o ms variables
explicatorias que se pueden usar para predecir la pertenencia a un
grupo. Hay dos formas de predecir la pertenencia a un grupo. La
forma ms general, vlida para un nmero ilimitado de grupos, es
calcular la distancia estadstica de cada observacin con respecto a
la media de cada grupo para clasificar la observacin segn su
distancia estadstica ms pequea. El segundo mtodo, que se usa en
el caso de dos grupos, es calcular una funcin discriminatoria (una
expresin lineal de variables explicatorias) y clasificar cada
observacin basndose en si su valor discriminatorio es menor o
mayor que un valor de corte dado. Este segundo mtodo tambin
permite especificar probabilidades anteriores de pertenencia al grupo,
as como los costos de una clasificacin incorrecta. Entonces, el
procedimiento de clasificacin es equivalente a minimizar el costo
esperado de una clasificacin incorrecta.
Este anlisis se configura usando el cuadro de dilogo Anlisis
discriminatorio:

Cuadro de dilogo
Anlisis
discriminatorio

Gua de referencia: Comandos del men de StatTools 131

Para este anlisis debe seleccionarse una variable dependiente (D) y
una o ms variables independientes (I). Los datos deben estar en
formato desagrupado. Las variables pueden ser de conjuntos de
datos diferentes.
Las opciones del cuadro de dilogo Anlisis discriminatorio son:
Incluir resumen de clasificacin con el informe de regresin.
Incluir varianzas y covarianzas con el informe de regresin.
Incluir resultados de clasificacin con el informe de
regresin.
Usar tabla de clasificacin incorrecta, que se selecciona si
desea cambiar probabilidades anteriores o costos de
clasificacin incorrecta.
Incluir prediccin, que permite generar los valores de
prediccin de la variable dependiente para los valores de la
variable independiente en un segundo conjunto de datos. Este
conjunto de datos de prediccin debe tener los mismos
nombres de variable que el conjunto de datos originales que
la regresin est analizando. Normalmente, en el conjunto de
datos de prediccin tendr grupos de valores de variables
independientes para los cuales desea predecir el valor de la
variable dependiente. La ecuacin de regresin calculada a
partir del primer conjunto de datos se usa para hacer las
predicciones. Los valores de prediccin de la variable
dependiente se introducen directamente en el conjunto de
datos de prediccin; llenando la columna (o fila) de la
variable dependiente con los valores de la prediccin.
Si hay exactamente dos grupos posibles para la variable de categora
dependiente (como en este ejemplo) y la opcin Usar tabla de
clasificacin incorrecta est seleccionada, aparece un cuadro de
dilogo que permite especificar probabilidades anteriores y /o costos
de clasificacin incorrecta. Las configuraciones predeterminadas son
que cada grupo tenga las mismas probabilidades y que los costos de
clasificacin incorrecta sean iguales, pero estas configuraciones se
pueden cambiar.

Cuadro de dilogo
Costos de
Clasificacin
Incorrecta

132 Men Regresin y clasificacin


El informe Anlisis discriminatorio incluye los datos originales
adems de los datos usados para la clasificacin. Las clasificaciones de
prediccin depende de si los valores discriminatorios que se muestran
estn por encima o por debajo del valor de corte. Si las probabilidades
anteriores y los costos de clasificacin incorrecta se dejan en sus
valores predeterminados, este procedimiento de clasificacin es
equivalente a basar la clasificacin en la menor de las dos distancias
estadsticas. De hecho, si hubiera ms de dos grupos, los valores
discriminatorios no apareceran y la clasificacin se basara en la
menor de las distancias estadsticas.
Informe Anlisis
discriminatorio

Gua de referencia: Comandos del men de StatTools 133

El informe tambin muestra estadsticas descriptivas de los grupos y
los coeficientes de la funcin discriminatoria (slo se hace cuando hay
dos grupos), las probabilidades anteriores, los costos de clasificacin
incorrecta y el valor de corte de la clasificacin incorrecta (de nuevo,
slo se hace cuando hay dos grupos) y los resultados de resumen del
procedimiento de clasificacin (con comentarios de celda que ayudan
a interpretar los resultados). En este ejemplo vemos que 89% de las
observaciones estn clasificadas correctamente. Por supuesto,
esperamos que este porcentaje sea lo ms grande posible.
Generalmente, la nica forma de mejorar los resultados es usar ms (o
mejores) variables explicatorias.
Datos que faltan Si faltan valores, se ignora cualquier fila en
la que falte valor de cualquiera de las variables seleccionadas.
Enlace de datos No hay enlace con los datos originales. Si
cambian los datos, debe ejecutar el anlisis de nuevo.
Datos que faltan y
enlace a datos

134



Gua de referencia: Comandos del men de StatTools 135

El men Control de calidad
Los procedimientos del men Control de calidad se refieren a los
anlisis de datos recogidos en diferentes momentos, y tienen
aplicaciones de control de calidad.
La grfica de Pareto muestra la importancia relativa de los datos
categorizados.
Los cuatro tipos de grficas de control dibujan los datos de las series
de tiempo y permiten ver si un proceso est en control estadstico. Se
puede ver si los datos permanecen dentro de los lmites de control del
grfico y podemos comprobar otros comportamientos no aleatorios
como ejecuciones largas por encima o por debajo de la lnea central.
El comando Grfica de Pareto
Crea una grfica de Pareto de la variable categorizada
Las grficas de Pareto son tiles para determinar los elementos ms
significativos de un grupo de datos categorizados, as como para
ofrecer una representacin visual rpida de su importancia relativa.
Normalmente, las grficas de Pareto se usan en reas de control de
calidad para determinar los pocos factores ms significativos (la regla
80/20 de Pareto).
Por ejemplo, un fabricante de piezas de maquinaria decide investigar
por qu los clientes han estado rechazando un producto determinado.
Cuando se devuelve cada lote, se introduce una razn (tamao
incorrecto, superficie de acabado incorrecta, etc.). Despus de
varios meses de recoger datos, se dibuja una grfica de Pareto. Se
toman medidas para solucionar las fuentes ms importantes de
problemas.
StatTools permite crear grficas de Pareto de datos con dos formatos:
Slo categora o Categora y Valor. Una variable Slo categora
normalmente contiene una entrada por cada lectura. En el ejemplo
anterior, cada celda se corresponde con la razn por la que se
devolvi un lote de piezas. Un valor de celda puede ser superficie de
acabado incorrecta y probablemente habr muchas celdas
duplicadas. StatTools cuenta el nmero de veces que aparece cada
entrada en la variable y crea la grfica de Pareto correspondiente.
Cuando se selecciona Categora y Valor, las variables especificadas
son las categoras y sus cuentas correspondientes.

136 El men Control de calidad

Los ejes de la grfica de Pareto se crean de la siguiente forma:
Las categoras se colocan a lo largo del eje horizontal
La frecuencia (o cuentas) se coloca a lo largo del eje vertical
izquierdo
El porcentaje acumulativo se coloca a lo largo del eje vertical
derecho

Las opciones del cuadro de dilogo Grfica de Pareto son:
Tipo de datos. Selecciona el tipo de datos que se usan para
crear la grfica de Pareto: Categora y Valor o Slo categora.
Las opciones del cuadro de dilogo Opciones de categora son:
Ninguno Cada categora distinta se representa con una
barra en la grfica de Pareto.
Incluir categora adicional con valor fijo de se aade una
barra con la etiqueta Varios en el lado del extremo derecho
d la grfica de Pareto con una frecuencia igual al valor
especificado.
Combinar todas las categoras con valores menores o
iguales a Se combinan todas las categoras cuyas frecuencias
son menores o iguales al valor especificado en una categora
con la etiqueta Varios y se coloca en el extremo derecho de
la grfica de Pareto.

Cuadro de dilogo
Grfica de Pareto

Gua de referencia: Comandos del men de StatTools 137



Datos que faltan Si faltan valores, se ignora cualquier fila en
la que falte valor de cualquiera de las variables seleccionadas.
Enlace de datos No hay enlace con los datos originales. Si
cambian los datos, debe ejecutar el anlisis de nuevo.
Datos que faltan y
enlace a datos

138 El men Control de calidad

El comando Grficas X/R
Crea grficas de control X y R para las series de tiempo de las
variables
Esta anlisis produce grficas de barra X y R para las series de tiempo
de los datos. Se presupone que los datos se han recogido en pequeas
sub-muestras a lo largo del tiempo. Por ejemplo, un operador puede
recoger medidas de los anchos de cuatro piezas seleccionadas
aleatoriamente cada media hora. Entonces, el tamao de la sub-
muestra es 4. Si se recogen datos de 50 periodos de media hora, los
datos deben organizarse en cuatro columnas seguidas y 50 filas
seguidas, con ttulos de variable, como de SubMuestra1 a
SubMuestra4, sobre la primera fila de datos.
El propsito del procedimiento es comprobar si el proceso que est
generando los datos est bajo control estadstico. Para hacerlo, el
procedimiento calcula primero una barra X y una R para cada fila del
conjunto de datos. La barra X es el promedio de las observaciones de
esa fila, y R es el rango (mximo menos mnimo) de las observaciones
de esa fila.
Las barras X y R se dibujan en diagramas de series de tiempo
separados alrededor de las lneas centrales. La lnea central de la
grfica de barra X es el promedio de las barras X (que a veces se
llaman doble barra X), y la lnea central de la grfica R es una barra R,
promedio de los valores R. Una forma sencilla de comprobar si el
proceso est bajo control es ver si alguna de las barras X o R se salen
de sus respectivos lmites de control superior e inferior (UCL y LCL),
que son aproximadamente ms o menos 3 desviaciones estndar de
las lneas centrales. Las grficas muestran estos lmites de control, de
forma que resulta fcil ver cualquier valor extremo.
El procedimiento tambin permite comprobar otros posibles
comportamientos fuera de control, como 8 o ms puntos en una fila
por encima o por debajo de la lnea central, 8 o ms puntos en una fila
en una direccin hacia arriba o hacia abajo, al menos 4 de 5 puntos en
una fila a ms de una desviacin estndar de la lnea central, y al
menos 2 de 3 puntos en una fila a ms de dos desviaciones estndar
de la lnea central.

Gua de referencia: Comandos del men de StatTools 139

Estos grficos se configuran usando el cuadro de dilogo Grficas de
control barra X y R:

Se pueden seleccionar dos o ms variables para su anlisis. El
conjunto de datos seleccionado debe ser de datos desagrupados. Las
variables pueden ser de conjuntos de datos diferentes.
Las Opciones de grfico de las Grficas de control barra X y R son:
Lmites de control Sigma 1 y Sigma 2 Aade lneas de
lmite de control a una y / o dos sigmas de la lnea media.
Estas lneas extra permiten comprobar otro tipo de
comportamientos fuera de control (las denominadas reglas de
zona).
Anlisis de zona A y zona B Nmero de puntos ms all de
la Zona A (2 sigma) y de la Zona B (1 sigma)
Ejecuciones arriba / abajo y Ejecuciones por encima / por
debajo Movimientos secuenciales arriba y abajo de longitud
8 o mayor
Limitar rango de grfico del ndice Limita los puntos del
grfico a un rango de puntos de datos de una variable (es
decir, el rango del ndice de inicio al ndice final)
Cuadro de dilogo
Grficas de
control barra
X y R

140 El men Control de calidad

Las opciones Clculos de lmite de control basados en del cuadro de
dilogo Grficas de Control de Barras X y R determinan los datos en
los que se basarn los clculos de lmites de control, que pueden ser:
Todas las observaciones Se usan todos los datos
disponibles en los clculos de lmite de control
Observaciones en rango Se usan los datos entre ndice de
inicio y ndice de parada en los clculos de lmite de control
Datos anteriores Crea lmites de control a partir de los datos
observados anteriormente. Simplemente introduzca el
Tamao de sub-muestra, Promedio R y Barra X promedio
que se calcul de los datos anteriores.


Grfica de Barra X
de ejemplo

Gua de referencia: Comandos del men de StatTools 141



Datos que faltan No se permite el uso de datos que faltan.
Enlace a datos Los grficos no estn enlazados a los datos.
Grfica R de
ejemplo
Datos que faltan y
enlace a datos

142 El men Control de calidad

El comando Grfica P
Crea grficas P de las series de tiempo de las variables
Las grficas P son para datos de atributo. Con los datos de atributo,
cada observacin indica el nmero (o fraccin) de elementos que no se
adaptan a las especificaciones de una muestra de elementos. Por
ejemplo, un proceso puede producir un cierto nmero de elementos
cada media hora, algunos de los cuales no se adaptan. Entonces, la
grfica P dibuja la fraccin de elementos de cada media hora que no
se adaptan. Como siempre, el propsito es ver si el proceso est bajo
control.
Este procedimiento requiere un conjunto de datos con al menos una
de las siguientes caractersticas: una variable que contenga el nmero
de elementos que no se adaptan de cada muestra o una variable que
contenga la Fraccin de elementos que no se adaptan de cada muestra.
Tambin puede haber una variable que contenga los tamaos de la
muestra. Si no hay una variable de tamao de la muestra disponible,
deber introducir un tamao de la muestra, que se presupone es
constante en todas las muestras. Sin embargo, si hay una variable de
tamao de la muestra, no es necesario que los tamaos de la muestra
sean iguales.

Gua de referencia: Comandos del men de StatTools 143

Este grfico se configura usando el cuadro de dilogo Grfica de
control P:

Para este anlisis se selecciona una variable de valor y, optativamente,
una variable de tamao. El conjunto de datos seleccionado debe ser de
datos desagrupados. Las variables pueden ser de conjuntos de datos
diferentes.
Las opciones Datos de entrada del cuadro de dilogo Grfica de
control P son:
Nmeros de elementos no adecuados Especifica que la
variable Valor ofrece el nmero real de elementos que no se
adaptan de entre el total de la muestra
Fracciones de elementos no adecuados Especifica que la
variable Valor ofrece la fraccin de elementos que no se
adaptan de la muestra
Cuadro de dilogo
Grfica de
control P

144 El men Control de calidad

Las opciones Tamao de la muestra del cuadro de dilogo Grfica de
control P son:
Usar variable de tamao Especifica que se usa una variable
de tamao para dar el tamao total de cada muestra
Usar tamao comn Especifica que no se usa variable de
tamao ya que cada muestra es el tamao introducido.
Las Opciones de grfico del cuadro de dilogo Grfica de control P
son:
Lmites de control Sigma 1 y Sigma 2 Aade lneas de
lmite de control a una y / o dos sigmas de la lnea media.
Estas lneas extra permiten comprobar otro tipo de
comportamientos fuera de control (las denominadas reglas de
zona).
Anlisis de zona A y zona B Nmero de puntos ms all de
la Zona A (2 sigma) y de la Zona B (1 sigma)
Ejecuciones arriba / abajo y Ejecuciones por encima / por
debajo Movimientos secuenciales arriba y abajo de longitud
8 o mayor
Limitar rango de grfico del ndice Limita los puntos del
grfico a un rango de puntos de datos de una variable (es
decir, el rango del ndice de inicio al ndice final)
Las opciones Clculos de lmite de control basados en del cuadro de
dilogo Grfica de control P determinan los datos en los que se
basarn los clculos de lmites de control, que pueden ser:
Todas las observaciones Se usan todos los datos
disponibles en los clculos de lmite de control
Observaciones en rango Se usan los datos entre ndice de
inicio y ndice de parada en los clculos de lmite de control
Datos anteriores Crea lmites de control a partir de los datos
observados anteriormente. Simplemente introduzca el
Tamao de sub-muestra y el Promedio P que se calcul de
los datos anteriores.

Gua de referencia: Comandos del men de StatTools 145



Datos que faltan No se permite el uso de datos que faltan.
Enlace a datos Los grficos no estn enlazados a los datos.
Grfica P de
ejemplo
Datos que faltan y
enlace a datos

146 El men Control de calidad

El comando Grfica C
Crea grficas C de las series de tiempo de las variables
Las grficas C se usan para dibujar el nmero de defectos de los
elementos de un tamao constante. Por ejemplo, supongamos que se
producen puertas de automviles en lotes de 50. En cada lote se
puede contar el nmero de defectos (a un error de pintura o un borde
sin pulir, por ejemplo). Estas cuentas se dibujan luego en una grfica.
Como siempre, el propsito es comprobar si el proceso est bajo
control.
El conjunto de datos de una grfica C debe incluir una variable que
contenga la cuenta de los defectos de cada elemento. Se presupone
que el tamao de la muestra es igual para cada observacin. Por
ejemplo, si un elemento es un lote de puertas de automviles, se
presupone que cada lote contiene el mismo nmero de puertas.
Este grfico se configura usando el cuadro de dilogo Grfica de
control C:

Se seleccionan una o ms variables para su anlisis. El conjunto de
datos seleccionado debe ser de datos desagrupados. Las variables
pueden ser de conjuntos de datos diferentes.
Cuadro de dilogo
Grfica de
control C

Gua de referencia: Comandos del men de StatTools 147

Las Opciones de grfico del cuadro de dilogo Grfica de control C
son:
Lmites de control Sigma 1 y Sigma 2 Aade lneas de
lmite de control a una y / o dos sigmas de la lnea media.
Estas lneas extra permiten comprobar otro tipo de
comportamientos fuera de control (las denominadas reglas de
zona).
Anlisis de zona A y zona B Nmero de puntos ms all de
la Zona A (2 sigma) y de la Zona B (1 sigma)
Ejecuciones arriba / abajo y Ejecuciones por encima / por
debajo Movimientos secuenciales arriba y abajo de longitud
8 o mayor
Limitar rango de grfico del ndice Limita los puntos del
grfico a un rango de puntos de datos de una variable (es
decir, el rango del ndice de inicio al ndice final)
Las opciones Clculos de lmite de control basados en del cuadro de
dilogo Grfica de control C determinan los datos en los que se
basarn los clculos de lmites de control, que pueden ser:
Todas las observaciones Se usan todos los datos
disponibles en los clculos de lmite de control
Observaciones en rango Se usan los datos entre ndice de
inicio y ndice de parada en los clculos de lmite de control
Datos anteriores Crea lmites de control a partir de los datos
observados anteriormente. Simplemente introduzca el
Promedio C que se calcul de los datos anteriores.


148 El men Control de calidad



Datos que faltan No se permite el uso de datos que faltan.
Enlace a datos Los grficos no estn enlazados a los datos.
Grfica C de
ejemplo
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 149

El comando Grfica U
Crea grficas U de las series de tiempo de las variables
Las grficas U son similares a las grficas C, pero en este caso se
dibuja la tasa de defectos. Usando el ejemplo de las puertas de
automviles, supongamos que los tamaos de los lotes no son
necesariamente iguales; es decir, diferentes lotes tienen diferentes
nmeros de puerta de automvil. Entonces, en una grfica U,
dibujaramos la tasa de defectos por puerta de automvil; es decir, el
nmero de defectos de un lote dividido entre el nmero de puertas
del lote. Como siempre, el propsito es comprobar si el proceso est
bajo control.
Este procedimiento requiere un conjunto de datos con al menos una
de las siguientes caractersticas: una variable que contenga el nmero
de defectos por cada observacin o una variable que contenga la tasa
de defectos de cada observacin. Tambin puede haber una variable
que contenga los tamaos de los elementos. Si no hay una variable de
tamao, deber introducir un tamao de elemento, que se presupone
es el tamao de elemento constante en todas las observaciones. Sin
embargo, si hay una variable de tamao, no es necesario que los
tamaos de elemento sean iguales.

150 El men Control de calidad

Este grfico se configura usando el cuadro de dilogo Grfica de
control U:

Para este anlisis se selecciona una variable de valor y, optativamente,
una variable de tamao. El conjunto de datos seleccionado debe ser de
datos desagrupados. Las variables pueden ser de conjuntos de datos
diferentes.
Las opciones Datos de entrada del cuadro de dilogo Grfica de
control U son:
Nmeros de defectos Especifica que la variable Valor ofrece
el nmero real de elementos que no se adaptan de entre el
total de la muestra
Tasa de defectos Especifica que la variable Valor ofrece la
fraccin de elementos que no se adaptan de la muestra
Cuadro de dilogo
Grfica de
control U

Gua de referencia: Comandos del men de StatTools 151

Las opciones Tamao de la muestra del cuadro de dilogo Grfica de
control U son:
Usar variable de tamao Especifica que se usa una variable
de tamao para dar el tamao total de cada muestra
Usar tamao comn Especifica que no se usa variable de
tamao ya que cada muestra es el tamao introducido.
Las Opciones de grfico del cuadro de dilogo Grfica de control U
son:
Lmites de control Sigma 1 y Sigma 2 Aade lneas de
lmite de control a una y / o dos sigmas de la lnea media.
Estas lneas extra permiten comprobar otro tipo de
comportamientos fuera de control (las denominadas reglas de
zona).
Anlisis de zona A y zona B Nmero de puntos ms all de
la Zona A (2 sigma) y de la Zona B (1 sigma)
Ejecuciones arriba / abajo y Ejecuciones por encima / por
debajo Movimientos secuenciales arriba y abajo de longitud
8 o mayor
Limitar rango de grfico del ndice Limita los puntos del
grfico a un rango de puntos de datos de una variable (es
decir, el rango del ndice de inicio al ndice final)
Las opciones Clculos de lmite de control basados en del cuadro de
dilogo Grfica de control U determinan los datos en los que se
basarn los clculos de lmites de control, que pueden ser:
Todas las observaciones Se usan todos los datos disponibles en
los clculos de lmite de control
Observaciones en rango Se usan los datos entre ndice de
inicio y ndice de parada en los clculos de lmite de control
Datos anteriores Crea lmites de control a partir de los datos
observados anteriormente. Simplemente introduzca el Tamao de
sub-muestra y el Promedio U que se calcul de los datos
anteriores.

152 El men Control de calidad



Datos que faltan No se permite el uso de datos que faltan.
Enlace a datos Los grficos no estn enlazados a los datos.

Grfica U de
ejemplo
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 153

El men Pruebas no paramtricas
Las pruebas no paramtricas son procedimientos estadsticos
aplicados a muestras de datos para probar hiptesis sobre las
distribuciones de probabilidad subyacentes. Las pruebas de hiptesis
paramtricas resultan ms familiares y son de uso ms comn; sin
embargo, la alternativa no paramtrica ofrece ventajas que la
convierten en la opcin ms apropiada en muchas situaciones.
Las pruebas de hiptesis paramtricas hacen presuposiciones sobre el
tipo de la distribucin subyacente (normalmente, es normal), y estima
los parmetros de ese tipo de distribucin (normalmente, la media y
la desviacin estndar). En muchas aplicaciones, la presuposicin de
normalidad sera incorrecta. por ejemplo, los nmeros de llamadas
por hora a un centro de servicio al cliente y el tiempo de espera en un
punto de salida de un supermercado no estn distribuidos
normalmente. Las pruebas no paramtricas no requieren ninguna
presuposicin sobre el tipo de la distribucin subyacente. Algunas de
ellas hacen ciertas presuposiciones generales sobre la forma de la
distribucin: en este grupo de pruebas, la Prueba de los signos de
Wilcoxon presupone que la distribucin es simtrica. Las otras dos
pruebas de este grupo (la Prueba de Signos y la Prueba de Mann-
Whitney) no presuponen nada sobre la forma de la distribucin.
Con tamaos de la muestra pequeos, la alternativa no paramtrica
resulta frecuentemente ms apropiada. Si la muestra es grande, se
puede aplicar una prueba de normalidad. Si la presuposicin de que
la distribucin es normal resulta justificada, se puede usar una prueba
paramtrica. Sin embargo, con tamaos de la muestra pequeos las
pruebas de normalidad tienen poca eficacia para diferenciar entre las
distribuciones normales y las dems. Las pruebas no paramtricas
pueden proporcionar una forma de resolver el dilema.

154 El men Pruebas no paramtricas

Con ciertos tipos de datos, las pruebas paramtricas no se pueden
usar, mientras que otras no paramtricas son aceptables. Uno de esos
casos son los datos ordinales en los que las observaciones se
describen en trminos de nmeros que expresan posiciones en una
clasificacin; sin embargo, la diferencia entre dos nmeros de estos no
es significativa. Por ejemplo, los niveles de educacin adquirida se
pueden codificar como 0 (inferior al instituto), 1 (algo de instituto), 2
(graduacin del instituto), 3 (algo de universidad), 4 (graduacin
universitaria) y 5 (post-universitaria). Cuando se usa esta escala, no
tiene significado que la diferencia de educacin adquirida entre tener
una graduacin del instituto y tener inferior al instituto sea
equivalente a la diferencia entre las categoras post-universitaria y
algo de universidad, aunque en ambos casos la diferencia entre las
clasificaciones sea igual a 2. Este grupo incluye pruebas que se
pueden aplicar a este tipo de datos: la Prueba del signo (tipo de
anlisis de una muestra) y la Prueba de Mann-Whitney.
En resumen, las pruebas no paramtricas son aplicables en las
siguientes situaciones, en las que las pruebas paramtricas no se
pueden usar:
cuando hay poca informacin sobre la distribucin de
probabilidad subyacente,
cuando el tamao de la muestra es demasiado pequeo para
probar fiablemente la presuposicin de normalidad,
cuando los datos son ordinales.

Datos ordinales
Resumen de usos

Gua de referencia: Comandos del men de StatTools 155

El comando Prueba del signo
Realiza la prueba de los signos en las variables
El comando Prueba del signos realiza pruebas de hiptesis de la
mediana de una sola variable (Anlisis de una muestra) o de la
mediana de las diferencias de un par de variables (Anlisis de par de
muestras). La prueba no hace ninguna presuposicin sobre la forma
de la distribucin (y en particular no presupone que sea normal). El
Anlisis de una muestra se puede usar con datos ordinales como se
describe en la Introduccin.
Este anlisis se configura usando el cuadro de dilogo Prueba del
signo:

El nmero de variables seleccionadas depende del tipo de anlisis que
se use. Un anlisis de una muestra requiere una o ms variables,
mientras que un anlisis de par de muestras requiere dos variables.
Para el anlisis de una muestra, las variables seleccionadas pueden ser
agrupadas o desagrupadas; para el anlisis de par de muestras, deben
ser des-agrupadas. Las variables pueden ser de conjuntos de datos
diferentes.

Cuadro de dilogo
Prueba del signo

156 El men Pruebas no paramtricas

Las opciones del cuadro de dilogo Prueba de los signos son:
Tipo de anlisis. Selecciona el tipo de anlisis a realizar. Las
opciones son:
- Anlisis de una muestra. Hace pruebas de hiptesis
de una sola variable numrica.
- Anlisis de par de muestras. Este anlisis es
apropiado cuando dos variables estn emparejadas
naturalmente. Es equivalente a un anlisis de una
muestra sobre las diferencias entre pares.
Mediana (o Mediana de diferencias).
- Valor de hiptesis nulo o el valor del parmetro de
la poblacin con una hiptesis nula.
- Tipo de hiptesis alternativa o la alternativa al Valor
de Hiptesis Nulo que se evaluar en el anlisis. La
Hiptesis Alternativa puede ser de una opcin (es
decir, mayor o menor que la hiptesis nula) o de dos
opciones (es decir, no igual a la hiptesis nula).


Informe de prueba
del signo

Gua de referencia: Comandos del men de StatTools 157

Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Datos que faltan y
enlace a datos

158 El men Pruebas no paramtricas

El comando Prueba de los signos de Wilcoxon
Realiza las pruebas de los signos de Wilcoxon en las variables
El comando Prueba de los signos de Wilcoxon realiza pruebas de
hiptesis de la mediana de una sola variable (Anlisis de una
muestra) o de la mediana de las diferencias de un par de variables
(Anlisis de par de muestras). La prueba presupone que la
distribucin de probabilidad es simtrica (pero no presupone que sea
normal).
Este anlisis se configura usando el cuadro de dilogo Prueba de los
signos de Wilcoxon:

El nmero de variables seleccionadas depende del tipo de anlisis que
se use. Un anlisis de una muestra requiere una o ms variables,
mientras que un anlisis de par de muestras requiere dos variables.
Para el anlisis de una muestra, las variables seleccionadas pueden ser
agrupadas o des-agrupadas; para el anlisis de par de muestras,
deben ser des-agrupadas. Las variables pueden ser de conjuntos de
datos diferentes.

Cuadro de dilogo
Prueba de los
signos de
Wilcoxon

Gua de referencia: Comandos del men de StatTools 159

Las opciones del cuadro de dilogo Prueba de los signos de
Wilcoxon son:
Tipo de anlisis. Selecciona el tipo de anlisis a realizar. Las
opciones son:
- Anlisis de una muestra. Hace pruebas de hiptesis
de una sola variable numrica.
- Anlisis de par de muestras. Este tipo de anlisis es
apropiado cuando dos variables estn emparejadas
naturalmente. Es equivalente a un anlisis de una
muestra sobre las diferencias entre pares.
Mediana (o Mediana de diferencias).
- Valor de hiptesis nulo o el valor del parmetro de
la poblacin con una hiptesis nula.
- Hiptesis alternativa o la alternativa al Valor de
Hiptesis Nulo que se evaluar en el anlisis. La
Hiptesis Alternativa puede ser de una opcin (es
decir, mayor o menor que la hiptesis nula) o de dos
opciones (es decir, no igual a la hiptesis nula).
Correccin de empates. Una seleccin recomendada que
corrige las clasificaciones empatadas de la prueba slo
cuando se usa aproximacin normal. La correccin incluye el
recuento del nmero de elementos de los grupos de
clasificaciones empatadas y la reduccin de la varianza
correspondientemente. La correccin de empates siempre
aumenta el valor de la estadstica z, si hay clasificaciones
empatadas presentes. (Nota: La correccin de empates no
produce ningn cambio en la varianza cuando no hay
empates).



160 El men Pruebas no paramtricas



Nota: En este informe, el valor p se calcula usando una aproximacin
normal cuando el tamao de la muestra es mayo que 15.

Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe de prueba
de los signos de
Wilcoxon
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 161

El comando Prueba de Mann-Whitney
Realiza la prueba de Mann-Whitney en las variables
El comando Prueba de Mann-Whitney realiza una prueba de la
hiptesis de dos muestras. En una versin de la prueba (la Versin
Mediana) la hiptesis afirma que las medianas de las dos poblaciones
son idnticas. En esta versin se presupone que las distribuciones de
probabilidad tienen la misma forma. En la otra versin (La Versin
General) no se hace esta presuposicin, y la hiptesis niega que
ninguna de las distribuciones de probabilidad tienda a generar
valores ms pequeos que la otra (ms exactamente, afirma que
P[X1>X2] = P[X2>X1], donde P[X1>X2] es la probabilidad de que una
observacin de la poblacin 1 sea mayor que una observacin de la
poblacin 2). Recuerde que la prueba de Mann-Whitney se puede usar
para rechazar la hiptesis de que dos muestras hayan sido generadas
por la misma distribucin de probabilidad. La prueba de Mann-
Whitney tambin se conoce como la prueba de suma de clasificacin
de Wilcoxon.
Este anlisis se configura usando el cuadro de dilogo Prueba de
Mann-Whitney:

El anlisis requiere dos variables. Pueden ser de datos agrupados o
desagrupados, y pueden provenir de diferentes conjuntos de datos.
Cuadro de dilogo
Prueba de Mann-
Whitney

162 El men Pruebas no paramtricas

Las opciones del cuadro de dilogo Mann-Whitney Test son:
Tipo de anlisis. Selecciona la formulacin de la hiptesis
nula y las alternativas. Las opciones son:
- Versin General. Realiza una prueba de hiptesis para
ver si una distribucin de probabilidad tiende a generar
valores ms pequeos que la otra.
Hiptesis.
o Hiptesis nula: Niega que una distribucin de
probabilidad tienda a generar valores ms
pequeos que la otra. Ms exactamente, afirma
que P[X1>X2] = P[X2>X1], donde P[X1>X2] es la
probabilidad de que una observacin de una
poblacin 1 sea mayor que una observacin de
una poblacin 2, y P[X2>X1] tiene una
interpretacin anloga. Para las distribuciones
continuas, esto es equivalente a afirmar que
ambas probabilidades son de 0.5
(P[X1>X2] = P[X2>X1] = 0.5).
o Tipo de hiptesis alternativa: La hiptesis
alternativa puede ser de una opcin (es decir,
una probabilidad es mayor o menor que la otra) o
de dos opciones (es decir, las dos
probabilidades no son iguales).
- Versin de mediana. Realiza una prueba de hiptesis
para ver si la mediana de una poblacin es la misma o
diferente a la mediana de la otra poblacin. Se presupone
que las dos distribuciones tienen la misma forma.
Hiptesis.
o Hiptesis nula: Afirma que las dos medianas son
iguales.
o Tipo de hiptesis alternativa: La hiptesis
alternativa puede ser de una opcin (es decir, la
mediana de la primera poblacin es mayor o
menor que la otra) o de dos opciones (es decir,
las medianas no son iguales).

Gua de referencia: Comandos del men de StatTools 163

Nota: Los clculos realizados en las versiones General y de Mediana
de la prueba son los mismas; las versiones difieren slo con respecto a
la presencia de la presuposicin de que la forma de las distribuciones
es igual, y con respecto a la hiptesis nula. La razn de tener estas dos
versiones es dejar claro que la prueba Mann-Whitney se puede aplicar
aunque no se pueda presuponer que las distribuciones tienen
aproximadamente formas idnticas, siempre que se considere una
hiptesis nula apropiada. Especficamente, si ejecuta la prueba
cuando las dos distribuciones tienen claramente formas diferentes, y
la prueba rechaza la hiptesis nula, puede ser porque las medianas
son diferentes, pero tambin puede ser porque las varianzas son
diferentes o por otras razones.
Correccin de empates. Una seleccin recomendada que
corrige las clasificaciones empatadas de la prueba slo cuando
se usa aproximacin normal. La correccin incluye el recuento
del nmero de elementos de los grupos de clasificaciones
empatadas y la reduccin de la varianza
correspondientemente. La correccin de empates siempre
aumenta el valor de la estadstica z, si hay clasificaciones
empatadas presentes. (Nota: La correccin de empates no
produce ningn cambio en la varianza cuando no hay
empates).


164 El men Pruebas no paramtricas


En el informe anterior, el Valor p se calcula usando una aproximacin
normal cuando el tamao de una de las dos muestras es mayor de 10
(excepto cuando uno de los tamaos es igual a 11 o 12, mientras que el
otro es igual a 3 o 4).

Datos que faltan Se permite el uso de datos que faltan. Se
ignoran todas las filas de las variables seleccionadas en las
que faltan datos.
Enlace a datos Todos los informes se calculan con las
frmulas enlazadas a los datos. Si cambia el valor de la
variable seleccionada, los resultados de salida cambian
automticamente.
Informe de prueba
Mann-Whitney
Datos que faltan y
enlace a datos

Gua de referencia: Comandos del men de StatTools 165

El men Utilidades
El comando Configuraciones de aplicacin
Especifica las configuraciones de los informes, grficos,
utilidades, conjuntos de datos y anlisis de StatTools
El comando Configuraciones de aplicacin permite especificar
configuraciones generales para los informes, grficos, utilidades,
conjuntos de datos y anlisis de StatTools. Estas configuraciones se
aplican en todos los anlisis y conjuntos de datos. Las dems
configuraciones especficas de cada anlisis se definen en el cuadro de
dilogo de cada anlisis.


166 El men Utilidades

Las configuraciones de informes especifica las opciones de los
informes y grficos creados con los anlisis de StatTools. Esto incluye
lo siguiente:
Colocacin Selecciona la ubicacin en Excel de los nuevos
informes y grficos, e incluye:
- Libro de trabajo activo, cuando se crea una nueva
hoja de trabajo para cada informe.
- Nuevo libro de trabajo, cuando se crea un nuevo
libro de trabajo de informe de StatTools (si fuera
necesario) y cada informe se coloca en una hoja de ese
libro de trabajo.
- Despus de la ltima columna utilizada de la hoja
activa, cuando cada informe de StatTools se coloca en
la hoja activa a la derecha de la ltima columna
utilizada.
- Consulta para la celda de inicio, cuando, despus de
ejecutar un anlisis, tiene la oportunidad de
seleccionar una celda que ser el ngulo superior
izquierdo en el que se colocar el informe o grfico.
- Volver a usar el mismo libro, cuando, si se crea un
nuevo libro de trabajo, ese mismo libro de trabajo se
usa para todos los informes.
Preferencia de actualizacin Especifica cmo cambian los
resultados cuando cambian los datos de la variable. Las
opciones de actualizacin de resultados son:
- En vivo Enlazado a los datos de entrada, cuando
los informes se actualizan automticamente cuando
cambian los datos de entrada.
- Esttica Los valores estn fijos, es decir, los
informes no cambian cuando se cambian los datos de
entrada. Las estadsticas estn fijas basndose en los
valores de entrada obtenidos cuando se ejecut el
procedimiento.
Configuraciones
de informes

Gua de referencia: Comandos del men de StatTools 167

Los resultados se actualizan en vivo en StatTools mediante el
uso de frmulas de Excel y funciones personalizadas de
StatTools. Por ejemplo, la frmula
=StatMean('Intervalo de confianza.xls'!Par)
calcula la media de la variable Par (que usa datos del rango de
Excel Par que se encuentra en el libro de trabajo Intervalo
de confianza.xls). Cuando cambian los datos del rango Par, se
actualiza el valor generado por la funcin StatMean.
Los informes y grficos de todos los procedimientos de
StatTools se pueden actualizar en vivo, con las siguientes
excepciones:
1) Regresin
2) Anlisis discriminatorio
3) Regresin logstica
4) Previsin
Estos procedimientos requieren una serie de reclculos
elaborados que haran que Excel no respondiera bien durante
la actualizacin en vivo.

168 El men Utilidades

Mostrar comentarios Especifica qu categoras de mensajes
de StatTools se incluyen en los informes. Las notas,
advertencias y notas educativas se pueden mostrar como
notas desplegables en las celdas del informe, como se muestra
aqu:


Gua de referencia: Comandos del men de StatTools 169

Las configuraciones de utilidades especifica las opciones de las
nuevas variables creadas por las Utilidades de datos de StatTools. Se
encuentran en el men Utilidades de datos. Crean nuevas variables
transformando, combinando o procesando de algn modo las
variables existentes.
Preferencia de nuevas variables Especifica la ubicacin
para las nuevas variables creadas por las utilidades de datos.
Las opciones son:
- Insertar en el conjunto de datos fuente, cuando las
nuevas variables creadas se introducen en el lado
derecho (o en la parte inferior) del conjunto de datos
que contiene la variable original.
- Crear nuevo conjunto de datos, cuando las nuevas
variables se colocan en un nuevo conjunto de datos
Sin embargo, hay casos en los que no se sigue la Preferencia
de Nuevas Variables seleccionada. Estos incluyen Datos
agrupados y desagrupados (en los que las nuevas variables se
colocan siempre en un nuevo conjunto de datos) y cuando los
datos originales son de un conjunto de datos de mltiples
rangos (en los que las nuevas variables slo se pueden
introducir en el conjunto de datos fuente)
Preferencia de actualizacin Especifica cmo cambian los
valores de las nuevas variables creadas por una utilidad
cuando cambian los datos de la variable original. Las
opciones de actualizacin son:
- En vivo Enlazado a los datos de entrada, cuando
los valores de la nueva variable se actualizan
automticamente cuando cambian los datos de
entrada.
- Esttico Los valores estn fijos, es decir, los valores
de la nueva variable no cambian cuando se cambian
los datos de entrada. Los valores de la nueva variable
estn fijos basndose en los valores de entrada
obtenidos cuando se ejecut el procedimiento.
Sin embargo, hay casos en los que no se sigue la preferencia
de actualizacin seleccionada y las nuevas variables siempre
usan la preferencia Esttico. Estos son Datos agrupados y
desagrupados y Muestras aleatorias. La actualizacin en vivo
no se aplica a estas utilidades.
Configuraciones
de utilidades

170 El men Utilidades

Las configuraciones de conjuntos de datos especifican las opciones de
los nuevos conjuntos de datos creados usando el comando
Administrador de conjunto de datos. Estas configuraciones son slo
valores predeterminados que aparecen cuando se crea un nuevo
conjunto de datos. Si lo desea puede cambiarlas en el cuadro de
dilogo Administrador de conjunto de datos.
Aplicar formato de celda Especifica si StatTools aplica el
formato al conjunto de datos.
Diseo de variable Selecciona el diseo de variable
predeterminado (por filas o por columnas)
Nombres en la primera columna / fila (rango primario)
Especifica si los nombres se introducen en la primera columna
o fila del primer rango definido.
Nombres en la primera columna / fila (rango secundario)
Especifica si los nombres se introducen en la primera columna
o fila del segundo rango y de los rangos subsiguientes en los
conjuntos de datos de mltiples rangos.
Las configuraciones de anlisis especifican las opciones
predeterminadas que aparecen en los cuadros de dilogo que se usan
para configurar los anlisis. Estas son slo las opciones que aparecen
cuando se abre por primera vez un cuadro de dilogo para realizar un
anlisis. Si lo desea, puede cambiarlas en cada cuadro de dilogo.
Mensaje de advertencia Selecciona si los mensajes de
advertencia aparecern al ejecutar un anlisis si StatTools
detecta datos que faltan en una variable o si StatTools detecta
datos no numricos.
Memoria de cuadro de dilogo - Especifica las opciones
predeterminadas que aparecen en los cuadros de dilogo que
se usan para configurar los anlisis. Las opciones son:
- Recordar los ltimos valores usados (por libro de
trabajo), cuando un cuadro de dilogo abierto
muestra las opciones que se seleccionaron en ese
cuadro de dilogo la ltima vez que se abri en ese
libro de trabajo activo. Si un cuadro de dilogo se
abre por primera vez, muestra las configuraciones
predeterminadas del sistema guardadas para ese
anlisis.
- Usar siempre valores predeterminados del sistema,
cuando un cuadro de dilogo abierto muestra las
Configuraciones
de conjuntos de
datos
Configuraciones
de anlisis

Gua de referencia: Comandos del men de StatTools 171

configuraciones predeterminadas del sistema
guardadas para ese anlisis.
Clculos de percentil Selecciona el mtodo que se va a usar
para calcular los percentiles. Dependiendo de la naturaleza de
los datos, mtodos diferentes pueden ofrecer mejores
respuestas. Los mtodos disponibles (y los tipos de datos para
los que son ms apropiados) son:
1) Automtico (basado en los datos de entrada)
2) Interpolados con puntos finales asimtricos (continuos)
3) Interpolados con puntos finales simtricos (continuos)
4) Funcin de percentil de Excel (continuos)
5) Observacin ms cercana (discreta)
6) Funcin de distribucin emprica (discreta)
7) Funcin de distribucin con promediado (discreta)

172 El men Utilidades

El comando Eliminar conjuntos de datos
Elimina los conjuntos de datos de StatTools del libro de trabajo
activo
El comando Eliminar conjuntos de datos elimina todos los
conjuntos de datos definidos de un libro de trabajo activo. No se
eliminan los datos de Excel; slo la definicin del conjunto de
datos.
El comando Borrar memoria del cuadro de
dilogo
Borra la memoria de todas las opciones de los cuadros de
dilogo de los anlisis
El comando Borrar memoria del cuadro de dilogo borra toda la
memoria de las opciones de los cuadros de dilogo del anlisis.
Los cuadros de dilogo que se abran despus mostrarn
inicialmente las configuraciones predeterminadas del sistema
guardadas para cada anlisis.
El comando Descargar complemento StatTools
Descarga el programa auxiliar de complemento StatTools
El comando Descargar complemento StatTools descarga StatTools y
cierra todas las ventanas de StatTools.

Gua de referencia: Comandos del men de StatTools 173

El men Ayuda
Ayuda de StatTools
Abre los archivos de ayuda electrnica de StatTools
El comando Ayuda de StatTools del men Ayuda se utiliza para abrir
el archivo principal de ayuda de StatTools. Todas las opciones y
comandos de StatTools se describen en este archivo.
Manual electrnico
Abre el manual electrnico de StatTools
El comando Manual Electrnico del men Ayuda abre el manual en
formato PDF. Para abrir el manual debe tener instalado el programa
Adobe Acrobat Reader.
El comando Activacin de licencia
Muestra la informacin de licencia de StatTools y permite
obtener licencia para versiones de prueba
El comando Activacin de Licencia del men Ayuda abre el cuadro de
dilogo Activacin de Licencia que contiene informacin sobre la
versin y licencia de su copia del programa StatTools. Con este
cuadro de dilogo tambin puede convertir una versin de prueba de
StatTools en una copia con licencia.
Para obtener ms informacin sobre licencias para su copia de
StatTools, consulte el Captulo 1: Introduccin de este manual.
El comando Acerca de
Muestra informacin sobre la versin y el copyright de StatTools
El comando Acerca De del men Ayuda abre el cuadro de dilogo
Acerca De que contiene informacin sobre la versin y el copyright de
StatTools.


174



Gua de referencia: Funciones de StatTools 175

Gua de referencia: Funciones
de StatTools
Introduccin
StatTools usa funciones de hoja de clculo personalizadas para
generar las estadsticas calculadas a las frmulas de Excel. Estas
funciones permiten:
1) Incorporar clculos estadsticos a frmulas de hojas de
clculo, como con las funciones estndar de Excel.
2) Estadsticas en vivo; es decir, los resultados cambian
cuando cambian los datos originales.
Si observa las frmulas de las celdas de un informe de StatTools, ver
las funciones de hoja de clculo de StatTools. Todas las funciones de
StatTools comienzan con el prefijo Stat, como StatMean() o
StatStdDev(). Todas las funciones de StatTools aparecen en el cuadro
de dilogo insertar Funcin de Excel para facilitar su introduccin.

176 Introduccin

Las funciones de StatTools y las funciones de
Excel
En algunos casos, StatTools reemplaza los clculos estadsticos
incorporados a Excel por sus propios clculos rpidos y eficaces. La
exactitud de los clculos estadsticos incorporados a Excel se ha
cuestionado con frecuencia, y StatTools no utiliza ninguno de estos
clculos. Incluso las funciones estadsticas de las hojas de clculo de
Excel como STDEV() han sido reemplazadas por nuevas versiones
ms eficaces de StatTools, como StatSTDEV(). Los clculos estadsticos
de StatTools superan las ms altas pruebas de exactitud, con un
funcionamiento optimizado mediante el uso de archivos DLL de C++,
no clculos por macro.
Las funciones de StatTools, a diferencia de las funciones incorporadas
de Excel, respaldan el uso de datos agrupados. La funcin
StatDestack de StatTools desagrupa automticamente los datos de un
conjunto de datos agrupados (de todas las categoras que especifique).
Luego pasa los datos a la funcin estadstica de StatTools para su
anlisis.
Las funciones de StatTools tambin respaldan el anlisis de datos que
residen en diferentes hojas de clculo. Los conjuntos de datos de
mltiples hojas permiten el uso de ms de 65535 puntos por variable.
Se introducen usando el botn Mltiple del cuadro de dilogo
Administrador de conjunto de datos.

Gua de referencia: Funciones de StatTools 177

Funciones de distribucin
StatTools incluye una serie de funciones de distribucin (como
StatBinomial) que reemplazan a las funciones de distribucin
incorporadas de Excel (como BinomDist). A diferencia de las
funciones de distribucin de Excel, las funciones de distribucin de
StatTools pueden generar una serie de valores diferentes a partir de
una distribucin de probabilidad. El valor generado se establece
mediante el argumento estadstica (el penltimo argumento de la
funcin). Este argumento puede ser un valor de 1 a 12 o una secuencia
que indique la estadstica que quiere obtener para la distribucin
introducida:

Valor o secuencia
introducida
Estadstica generada
1 o media media
2 o desviacin estndar desviacin estndar
3 o varianza varianza
4 o asimetra asimetra
5 o curtosis curtosis
6 o moda moda
7 o media discreta media discreta (o el valor ms cercano
a la media verdadera que realmente
se puede producir)
8 o x a y x a y (el valor y de la distribucin
para un valor x introducido)
9 o x a p x a p (el valor p de la distribucin
para un valor x introducido)
10 o p a x p a x (el valor x de la distribucin
para un valor p introducido)
11 o x a q x a q (el valor q de la distribucin
para un valor x introducido)
12 o q a x q a x (el valor x de la distribucin
para un valor q introducido)
Por ejemplo, la funcin de distribucin de StatTools:
StatNormal(10,1,x a p, 9.5)
genera un valor p asociado con un valor x de 9.5 en una distribucin
normal con una media de 10 y una desviacin estndar de 1.
Lista de posibles
estadsticas
generadas

178 Introduccin

Informes en vivo
StatTools usa funciones personalizadas para que los resultados sean
los ms en vivo posible. Es decir, siempre que resulte prctico, los
informes tienen frmulas que enlazan con los datos originales. Por
ejemplo, supongamos que tiene una variable Peso y quiere medidas de
resumen de Peso, como la media y la desviacin estndar. El
procedimiento de Estadstica de resumen asigna el nombre Peso al
rango de pesos y luego introduce las frmulas en las celdas de salida:
=StatMean(Peso) y =StatStdDev(Peso). StatMean y StatStdDev son
funciones incorporadas de StatTools para calcular la media y la
desviacin estndar. Estas reemplazan a las funciones incorporadas
estndar de Excel de las mismas estadsticas. Gracias a estas
funciones, cuando se cambian los datos, los resultados cambian
automticamente, para que no tenga que ejecutar de nuevo el
procedimiento.


Gua de referencia: Funciones de StatTools 179

Sin embargo, a veces no resulta prctico enlazar los resultados a los
datos. El ejemplo principal es la regresin. StatTools no proporciona
las frmulas que se usan para crear salidas de regresin; slo
proporciona los resultados numricos. En esos casos, si cambian los
datos, deber ejecutar de nuevo el procedimiento.
Puede usar la opcin Esttico del comando Configuraciones de
informes para que los informes no estn enlazados a los datos. Esto
resulta til si el tiempo de reclculo de Excel se convierte en un
problema cuando se cambian los datos.


180



Gua de referencia: Funciones de StatTools 181

Gua de referencia: Lista de funciones
estadsticas
Tabla de funciones disponibles
Esta tabla contiene una lista de funciones personalizadas que
StatTools aade a Excel. Cuando se usan, todas las funciones van
precedidas del prefijo Stat.
Funcin Resultado
AUTOCORRELATION(datos,
nmRetrasos)
Calcula la autocorrelacin de los valores de
un conjunto de datos
AVEDEV(Datos1, Datos2, ...DatosN)
Calcula la desviacin absoluta del promedio
de los datos con respecto a su media. Los
argumentos pueden ser nmeros, matrices o
rangos.
BINOMIAL(N, P, estadstica, valor)
Calcula la estadstica de la distribucin
binomial introducida
CATEGORYINDICIES(rango,
nombre_categora)
Obtiene los ndices de celda de una categora
especificada
CATEGORYNAMES(rango)
Obtiene los nombres de las categoras de un
rango
CATEGORYOCCURRENCECO
UNT(rango, nombre_categora)
Calcula el nmero de celdas de un rango en
una categora especificada
CHISQ(grado_libertad, estadstica,
valor)
Calcula la estadstica de la distribucin chi-
cuadrado de una opcin
CORRELATIONCOEFF(datos1,
datos2, indicador)
Calcula el coeficiente de correlacin entre 2
conjuntos de datos. Se puede calcular el
coeficiente lineal (Pearson) o el de orden de
clasificacin (Spearman)
COUNT(Datos1, Datos2, ...DatosN)
Calcula el nmero de elementos de sus
argumentos, que pueden ser nmeros,
matrices o rangos
COUNT CATEGORIES(rango)
Cuenta el nmero de categoras de un rango

COUNTCELLS BYTYPE(rango,
tipo)
Calcula el nmero de celdas de un tipo
especificado dentro de un rango
COUNTRANGE(Rango, ValorMn,
ValorMx, MnIncluido, MxIncluido)
Calcula el nmero de valores de un Rango
que se encuentra entre ValorMn y ValorMx
COVARIANCE(datos1, datos2)
Calcula la covarianza de la muestra entre 2
conjuntos de datos
COVARIANCEP(datos1, datos2)
Calcula la covarianza de la poblacin entre 2
conjuntos de datos. Los nmeros que faltan
generan un blanco

182 Gua de referencia: Lista de funciones estadsticas

Funcin Resultado
DESTACK(rango_datos,
categoras_rango_1, categora_1,
categoras_rango_2, categora_2)
Extrae datos de una categora especfica de
un grupo de datos agrupados
DURBINWATSON(datos)
Calcula la estadstica Durbin-Watson de los
valores de un conjunto de datos
F(grado_libertad1, grado_libertad2,
estadstica, valor)
Calcula la estadstica de la distribucin F
introducida para 2 conjuntos de datos
GETCELLVALUES(rango)
Obtiene los valores de todas las celdas de un
tipo especificado dentro de un rango
Error! Reference source not
found.(Datos1, Datos2, ... DatosN)
Calcula la curtosis de la muestra de sus
argumentos, que pueden ser nmeros,
matrices o rangos
CURTOSISP(Datos1, Datos2, ...
DatosN)
Calcula la curtosis de la poblacin de sus
argumentos, que pueden ser nmeros,
matrices o rangos
LN(x)
Calcula el logaritmo natural de un nmero
real positivo
MX(Datos1, Datos2, ...DatosN)
Calcula el mximo de sus argumentos, que
pueden ser nmeros, matrices o rangos
MEAN(Datos1, Datos2, ...DatosN)

Calcula la media aritmtica (promedio) de
sus argumentos, que pueden ser nmeros,
matrices o rangos
MEANABS(Datos1, Datos2,
...DatosN)
Calcula la media aritmtica (promedio) de
los valores absolutos de sus argumentos, que
pueden ser nmeros, matrices o rangos
MEDIAN(datos, indicador
discreto)
Calcula la mediana de un conjunto de datos
MIN(Datos1, Datos2, ...DatosN)
Calcula el mnimo de sus argumentos, que
pueden ser nmeros, matrices o rangos
NORMAL(media, desv_estn,
estadstica, valor)
Calcula la estadstica de la distribucin
normal (Gauss) introducida
PAIRCOUNT (Datos1, Datos2)
Cuenta el nmero de pares de celdas en los
que ambas celdas del par son numricas
PAIRMEAN(Datos1, Datos2)
Calcula la media de las diferencias entre
pares de celdas
PAIRMEDIAN(Datos1, Datos2)
Calcula la mediana de las diferencias entre
pares de celdas
PAIRSTDDEV(Datos1, Datos2)

Calcula la desviacin estndar de la muestra
de las diferencias entre pares de celdas
PERCENTILE (datos, p,
IndicDiscreto)
Calcula el percentil p de un conjunto de
datos
PRODUCT(Datos1, Datos2,
DatosN)
Calcula el producto de sus argumentos, que
pueden ser nmeros, matrices o rangos

Gua de referencia: Funciones de StatTools 183

Funcin Resultado
QUARTILE (datos, q, indicador
discreto)
Calcula el cuartil especificado de un
conjunto de datos
RAND()
Genera un nmero aleatorio en el rango 0
1.
RANGE (Datos1, Datos2, ...DatosN)
Calcula el rango (mximo mnimo) de sus
argumentos, que pueden ser nmeros,
matrices o rangos
RUNSTEST (datos, corte)
Calcula las ejecuciones de los valores de un
conjunto de datos
SKEWNESS(Datos1, Datos2,
...DatosN)
Calcula la asimetra de la muestra de sus
argumentos, que pueden ser nmeros,
matrices o rangos
SKEWNESSP(Datos1, Datos2,
...DatosN)
Calcula la asimetra de la poblacin de sus
argumentos, que pueden ser nmeros,
matrices o rangos
STANDARDIZE(x, media,
desv_estn)
Calcula un valor normalizado a partir de
una distribucin con la media y la
desviacin estndar especificadas
STDDEV (Datos1, Datos2, ...DatosN)
Calcula la desviacin estndar de la muestra
de sus argumentos, que pueden ser
nmeros, matrices o rangos
STDDEVP(Datos1, Datos2,
...DatosN)
Calcula la desviacin estndar de la
poblacin de sus argumentos, que pueden
ser nmeros, matrices o rangos
SUM(Datos1, Datos2, ...DatosN)
Calcula la suma de sus argumentos, que
pueden ser nmeros, matrices o rangos
SUMDEVSQ(Datos1, Datos2,
...DatosN)
Calcula la suma del cuadrado de la
desviacin de la media de sus argumentos,
que pueden ser nmeros, matrices o rangos
SUMSQ(Datos1, Datos2,
...DatosN)
Calcula la suma del cuadrado de sus
argumentos, que pueden ser nmeros,
matrices o rangos
STUDENT(grado_libertad,
estadstica, valor)
Calcula la estadstica de la distribucin T de
Student introducida
VARIANCE(Datos1, Datos2,
...DatosN)
Calcula la varianza de la muestra de sus
argumentos, que pueden ser nmeros,
matrices o rangos
VARIANCEP(Datos1, Datos2,
...DatosN)
Calcula la varianza de la poblacin de sus
argumentos, que pueden ser nmeros,
matrices o rangos


184 Gua de referencia: Lista de funciones estadsticas



Gua de referencia: Funciones de StatTools 185

Descripciones detalladas de las funciones
Esta es la lista de funciones estadsticas con sus argumentos
necesarios.

AUTOCORRELATION
Descripcin AUTOCORRELATION(datos,nmRetrasos) calcula la
autocorrelacin de los valores de los datos de un conjunto
de datos usando el nmero de retrasos nmRetrasos. datos
es la matriz o rango de datos para calcular la
autocorrelacin. nmRetrasos es el nmero de retrasos que
se va a usar.
Ejemplos StatAutocorrelation(C1:C100,1) genera la autocorrelacin
de los datos del rango C1:C100 con 1 retraso.
Reglas nmRetrasos debe ser mayor o igual a 1.

AVEDEV
Descripcin AVEDEV(Datos1,Datos2,...DatosN) calcula la desviacin
absoluta del promedio de Datos1,Datos2,...DatosN con
respecto a la media.
Ejemplos StatAveDev(1,2,5) calcula la desviacin absoluta del
promedio de 1, 2 y 5 con respecto a su media.
Reglas Los argumentos Datos1,Datos2,...DatosN pueden ser
nmeros, matrices o rangos.

BINOMIAL
Descripcin BINOMIAL(N,P,estadstica,valor) calcula la estadstica de la
distribucin binomial que tiene los valores N y P
especificados.
Ejemplos StatBinomial(2,.3,x a p,1) calcula el valor p para un valor
x de 1 en la distribucin binomial con N=2 y P =.3
Reglas N es el nmero de pruebas o sucesos y debe ser un nmero
entero >0
P es la probabilidad y debe ser >=0 y <=1.
estadstica es un valor entero de 1 a 12 o una secuencia que
indica la estadstica que se va a generar. Para obtener ms
informacin consulte la seccin Funciones de Distribucin
al principio de este captulo.
valor debe ser >= 0 (cuando se introduce un valor x) o >=0
y <=1 (cuando se introduce un valor p).


186 Gua de referencia: Lista de funciones estadsticas

CATEGORYINDICIES
Descripcin CATEGORYINDICES(rango, nombre_categora) obtiene los
ndices de las celdas que contienen el nombre_categora
especificado con el rango de Excel. Esta es una funcin de
matriz y los ndices generados son nmeros de ndice
(entre 1 y el nmero de celdas del rango) indicando las
posiciones de las celdas que contienen nombre_categora
dentro del rango.
Ejemplos StatCategoryIndices(C1:C100,Hombre) genera los
ndices (entre 1 y 100) de las celdas que contienen la
secuencia Hombre.
Reglas rango es un rango vlido de Excel
nombre_categora es una secuencia, valor o referencia de
celda que especifica la categora que se va a buscar

CATEGORYNAMES
Descripcin CATEGORYNAMES(rango) obtiene los nombres de las
categoras en el rango especificado de Excel. Esta es una
funcin de matriz y el nmero de nombres generados est
entre 1 y el nmero de celdas del rango.
Ejemplos StatCategoryNames(C1:C100) genera los nombres de las
categoras del rango C1:C100.
Reglas rango es un rango vlido de Excel

CATEGORYOCCURRENCECOUNT
Descripcin CATEGORYOCCURRENCECOUNT(rango,
nombre_categora) genera el nmero de celdas que
contienen el nombre_categora especificado en el rango de
Excel.
Ejemplos StatCategoryOccurrenceCount(C1:C100,Hombre)
genera el nmero de celdas del rango C1:C100 que
contienen Hombre.
Reglas rango es un rango vlido de Excel
nombre_categora es una secuencia, valor o referencia de
celda que especifica la categora que se va a buscar


Gua de referencia: Funciones de StatTools 187

CHISQ
Descripcin CHISQ(grado_libertad,estadstica,valor) calcula la estadstica
de la distribucin chi-cuadrado de una opcin usando los
grados de libertad especificados en grado_libertad.
Ejemplos StatChisq(2,x a p,5) calcula la distribucin chi-cuadrado
de una opcin en el valor 5 con 2 grados de libertad
Reglas el nmero de grados de libertad de grado_libertad debe
estar dentro del rango 1-32767
estadstica es un valor entero de 1 a 12 o una secuencia que
indica la estadstica que se va a generar. Para obtener ms
informacin consulte la seccin Funciones de Distribucin
al principio de este captulo.
valor debe ser >= 0 (cuando se introduce un valor x) o >=0
y <=1 (cuando se introduce un valor p).

CORRELATIONCOEFF
Descripcin CORRELATIONCOEFF(datos1,datos2, indicador) calcula el
coeficiente de correlacin entre dos conjuntos de datos
datos1 y datos2. Se puede calcular el coeficiente lineal
(Pearson) o el de orden de clasificacin (Spearman)
dependiendo del valor del indicador.
Ejemplos StatCorrelationCoeff(A1:A100,B1:B100) calcula el
coeficiente de correlacin entre dos conjuntos de datos
ubicados en A1:A100 y B1:B100.
Reglas datos1 y datos2 deben tener el mismo nmero de elementos.
Si el indicador se omite o es igual a cero, se calcula el
coeficiente de correlacin lineal (Pearson); si el indicador no
es igual a cero, se calcula el coeficiente de correlacin de
orden de clasificacin (Spearman).

COUNT
Descripcin COUNT(datos1,datos2,...datosN) calcula el nmero de
elementos de datos1,datos2 hasta datosN, que pueden ser
nmeros, matrices o rangos.
Ejemplos StatCount(A1:A100,B1:B100) calcula el nmero de
elementos de los dos conjuntos de datos ubicados en
A1:A100 y B1:B100.
Reglas datos1,datos2,...datosN son de 1 a 30 argumentos, que
pueden ser nmeros, matrices o rangos.


188 Gua de referencia: Lista de funciones estadsticas

COUNT CATEGORIES
Descripcin COUNTCATEGORIES(rango) genera el nmero de
categoras del rango de Excel especificado.
Ejemplos StatCountCategories(C1:C100) genera el nmero de
categoras del rango C1:C100.

Reglas rango es un rango vlido de Excel

COUNTCELLS BYTYPE
Descripcin COUNTCELLSBYTYPE(rango, tipo) calcula el nmero de
elementos del rango introducido que pertenecen al tipo
especificado.
Ejemplos StatCountCellsByType(A1:A100,1) calcula el nmero de
elementos del conjunto de datos de A1:A100 que son
numricos.
Reglas rango es un rango vlido de Excel
tipo es 1=numrico, 2=no vaco, 3=no vaco, no numrico,
4=vaco. Nota: StatTools considera que una celda que slo
contiene espacios est vaca.

COUNTRANGE
Descripcin COUNTRANGE(rango,ValorMn,ValorMx,
MnIncluido,MxIncluido) calcula el nmero de valores del
rango que estn entre ValorMn y ValorMx. Los valores
que sean iguales a ValorMn y ValorMx se pueden incluir
configurando los parmetros MnIncluido y /o MxIncluido
en VERDADERO.
Ejemplos StatCountRange(A1:A100,1,10,VERDADERO,
VERDADERO) calcula el nmero de valores del conjunto
de datos de A1:A100 que estn en el rango >=1 y <=10.
Reglas rango es el rango de celdas en el que quiere contar los
valores.
ValorMn es el valor mnimo del rango.
ValorMx es el valor mximo del rango.
MnIncluido es un valor booleano que indica si el
ValorMnimo debe incluirse en la cuenta. La configuracin
predeterminada es VERDADERO.
MxIncluido es un valor booleano que indica si el
ValorMximo debe incluirse en la cuenta. La configuracin
predeterminada es VERDADERO.


Gua de referencia: Funciones de StatTools 189

COVARIANCE
Descripcin COVARIANCE(datos1,datos2) calcula la covarianza de la
muestra entre los conjuntos de datos datos1 y datos2.
Ejemplos StatCovariance(A1:A100,B1:B100) calcula la covarianza de
la muestra entre dos conjuntos de datos ubicados en
A1:A100 y B1:B100.
Reglas datos1 y datos2 pueden ser matrices o rangos.
datos1 y datos2 deben tener el mismo nmero de elementos.

COVARIANCEP
Descripcin COVARIANCEP(datos1,datos2) calcula la covarianza de la
poblacin entre 2 conjuntos de datos datos1 y datos2.
Ejemplos StatCovarianceP(A1:A100,B1:B100) calcula la covarianza
de la poblacin entre dos conjuntos de datos ubicados en
A1:A100 y B1:B100.
Reglas datos1 y datos2 pueden ser matrices o rangos.

DESTACK
Descripcin DESTACK(rango_datos,categoras_rango_1,category_1,catego
ras_rango_2,categora_2) extrae los datos de la categora
especificada categora_1 de los datos agrupados de
rango_datos. Esta funcin permite que otras funciones
estadsticas de StatTools acepten datos agrupados como
entradas. Por lo tanto, la funcin StatDestack slo aparece
incorporada a otras funciones, como se muestra en este
ejemplo. Genera una matriz de datos de la categora
especificada extrados de rango_datos.
Ejemplos StatMean(StatDestack(B1:B100,A1:A100,Hombre))
calcula la media de los valores del rango B1:B100 cuyo
rango correspondiente de categoras A1:A100 tiene el valor
Hombre.
Reglas rango_datos es el rango con los datos agrupados.
categoras_rango_1 es el rango con el primer nombre de
categora.
categora_1 es la primera categora para la cual se obtienen
datos.
categoras_rango_2 (opcional) es el rango con el segundo
nombre de categora.
categora_2 (opcional) es la segunda categora para la cual se
obtienen datos.


190 Gua de referencia: Lista de funciones estadsticas

DURBINWATSON
Descripcin DURBINWATSON(datos) calcula la estadstica Durbin-
Watson de los valores del conjunto de datos datos.
Ejemplos StatDurbinWatson(A1:A100) calcula la estadstica Durbin-
Watson del rango de datos A1:A100.
Reglas datos puede ser una matriz o un rango de datos.

F
Descripcin F(grado_libertad1,grado_libertad2,estadstica,valor) calcula la
estadstica de la distribucin F usando el numerador de
grado de libertad grado_libertad1 y el denominador de
grado de libertad grado_libertad2.
Ejemplos StatF(1,1,x a p,1.5) calcula el valor p de la distribucin F
de un valor x de 1.5 con un numerador de grado de
libertad =1 y un denominador de grado de libertad =1 .
Reglas grado_libertad1 y grado_libertad2 debe ser un nmero entero
> 0.
estadstica es un valor entero de 1 a 12 o una secuencia que
indica la estadstica que se va a generar. Para obtener ms
informacin consulte la seccin Funciones de Distribucin
al principio de este captulo.
valor debe ser >= 0.

GETCELLVALUES
Descripcin GETCELLVALUES(rango,tipoCelda) obtiene los valores de
todas las celdas del tipo especificado en el rango
Ejemplos StatGetCellValues(A1:A100,2) obtiene los valores de
celdas no vacas que se encuentran en el rango A1:A100.
Reglas rango es el rango de celdas en el que quiere obtener los
valores.
tipoCelda es 0 para todas, 1 para numricas, 2 para no
vacas, 3 para no vacas, no numricas y 4 para celdas
vacas.


Gua de referencia: Funciones de StatTools 191

CURTOSIS
Descripcin CURTOSIS(Datos1,Datos2,...DatosN) calcula la curtosis de
la muestra especificada en Datos1,Datos2,...DatosN. Nota:
La funcin StatCurtosis calculada con datos distribuidos
normalmente genera el valor 3.
Ejemplos StatCurtosis(A1:A100,{1;2;3;2.4}) calcula la curtosis de la
muestra del conjunto de datos que se encuentra en
A1:A100 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

CURTOSISP
Descripcin CURTOSIS(Datos1,Datos2,...DatosN) calcula la curtosis de
la poblacin especificada en Datos1,Datos2,...DatosN. Nota:
La funcin StatCurtosisP calculada con datos distribuidos
normalmente genera el valor 3.
Ejemplos StatCurtosisP(A1:A100,{1;2;3;2.4}) calcula la curtosis de la
poblacin del conjunto de datos que se encuentra en
A1:A100 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

LN
Descripcin LN(x) calcula el logaritmo natural.
Ejemplos StatLN(4.5) calcula el logaritmo natural de 4.5.
Reglas x debe ser un nmero positivo real.

MX
Descripcin MAX(Datos1,Datos2,...DatosN) calcula el mximo de los
datos especificados en Datos1,Datos2,...DatosN.
Ejemplos StatMax(A1:A100,{1;2;3;2.4}) calcula el valor mximo del
conjunto de datos que se encuentra en A1:A100 y los
valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.


192 Gua de referencia: Lista de funciones estadsticas

MEAN
Descripcin MEAN(Datos1,Datos2,...DatosN) calcula la media de los
datos especificados en Datos1,Datos2,...DatosN.
Ejemplos StatMean(A1:A100,{1;2;3;2.4}) calcula el valor de la media
del conjunto de datos que se encuentra en A1:A100 y los
valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

MEANABS
Descripcin MEANABS(Datos1,Datos2,...DatosN) calcula la media del
valor absoluto de los datos especificados en
Datos1,Datos2,...DatosN.
Ejemplos StatMeanAbs(A1:A100,{1;2;3;2.4}) calcula la media del
valor absoluto del conjunto de datos que se encuentra en
A1:A100 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

MEDIAN
Descripcin MEDIAN(datos,IndicadorCalc) calcula la mediana de los
valores ubicados en datos. Se puede calcular usando cinco
mtodos alternativos, que se pueden especificar
opcionalmente con el argumento IndicadorCalc.
Ejemplos StatMedian(A1:A100,1) calcula el valor de la mediana del
conjunto de datos ubicado en A1:A100. Los datos son
continuos.
Reglas datos es un rango de Excel.
IndicadorCalc es un argumento opcional que puede ser un
valor entero con un rango de -1 a 5. Este valor se
corresponde con el mtodo deseado para calcular el
percentil.
-1 o no especificado) Automtico (se basa en los datos de
entrada)
0) Igual que la Funcin de Percentil de Excel (continuos)
1) Interpolados con puntos finales asimtricos (continuos)
2) Observacin ms cercana (discreta)
3) Funcin de distribucin emprica (discreta)
4) Interpolados con puntos finales simtricos (continuos)
5) Funcin de distribucin con promediado (discreta)


Gua de referencia: Funciones de StatTools 193

MIN
Descripcin MIN(Datos1,Datos2,...DatosN) calcula el mnimo de los
datos especificados en Datos1,Datos2,...DatosN.
Ejemplos StatMin(A1:A100,{1;2;3;2.4}) calcula el valor mnimo del
conjunto de datos que se encuentra en A1:A100 y los
valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos

MODE
Descripcin MODE(Datos,Is_discretos) calcula la moda del conjunto de
datos.
Ejemplos StatMode(A1:A100,FALSO) calcula la moda del conjunto
de datos ubicado en A1:A100. Los datos son continuos.
Reglas Datos es la matriz o rango de datos para los que se calcula
la moda.
Is_discretos es un argumento opcional y especifica si los
datos se van a tratar como discretos (verdadero) o
continuos (falso). Si no se especifica, se determina
automticamente a partir de los datos.

NORMAL
Descripcin NORMAL(media,desv_estn,estadstica,valos) calcula la
estadstica de la distribucin normal especificada por media
y desv_estn.
Ejemplos StatNormal(2,1,x a p,3) calcula el valor p de un valor x
de 3 en la distribucin normal con media=2 y desviacin
estndar=1
Reglas media es la media aritmtica de la distribucin
desv_estn es la desviacin estndar de la distribucin.
Debe ser > 0.
estadstica es un valor entero de 1 a 12 o una secuencia que
indica la estadstica que se va a generar. Para obtener ms
informacin consulte la seccin Funciones de Distribucin
al principio de este captulo.
valor debe ser >=0 y <=1 cuando se introduce un valor p.


194 Gua de referencia: Lista de funciones estadsticas

PAIRCOUNT
Descripcin PAIRCOUNT(Datos1,Datos2) cuenta el nmero de pares
de celdas de Datos1 y Datos2. Slo se cuentan pares de
celdas numricas. No se cuenta si falta un valor en
cualquiera de los rangos.
Ejemplos StatPairCount(A1:A100,B1:B100) cuenta el nmero de
pares de celdas numricas de los conjuntos de datos
ubicados en A1:A100 y B1:B100.
Reglas Datos1 y Datos2 deben ser rangos de Excel de igual
tamao.
Se seleccionan pares de celdas de Datos1 y Datos2 por filas,
comenzando en la parte superior izquierda.

PAIRMEAN
Descripcin PAIRMEAN(Datos1,Datos2) calcula la media de las
diferencias entre pares de celdas de Datos1 y Datos2. Los
clculos son slo de celdas numricas. No se cuenta si falta
un valor en cualquiera de los rangos.
Ejemplos StatPairMean(A1:A100,B1:B100) calcula la media de las
diferencias entre pares de celdas numricas de los
conjuntos de datos ubicados en A1:A100 y B1:B100.
Reglas Datos1 y Datos2 deben ser rangos de Excel de igual
tamao.
Se seleccionan pares de celdas de Datos1 y Datos2 por filas,
comenzando en la parte superior izquierda.


Gua de referencia: Funciones de StatTools 195

PAIRMEDIAN
Descripcin PAIRMEDIAN(Datos1,Datos2) calcula la mediana de las
diferencias entre pares de celdas de Datos1 y Datos2. Los
clculos son slo de celdas numricas. No se cuenta si falta
un valor en cualquiera de los rangos. La mediana se puede
calcular usando cinco mtodos alternativos, que se pueden
especificar opcionalmente con el argumento
IndicadorMtodo.
Ejemplos StatPairMedian(A1:A100,B1:B100) calcula la mediana de
las diferencias entre pares de celdas numricas de los
conjuntos de datos ubicados en A1:A100 y B1:B100.
Reglas Datos1 y Datos2 deben ser rangos de Excel de igual
tamao.
Se seleccionan pares de celdas de Datos1 y Datos2 por filas,
comenzando en la parte superior izquierda.
IndicadorMtodo es un argumento opcional que puede ser
un valor entero con un rango de -1 a 5. Este valor se
corresponde con el mtodo deseado para calcular la
mediana.
-1 o no especificado) Automtico (se basa en los datos de
entrada)
0) Igual que la Funcin de Percentil de Excel (continuos)
1) Interpolados con puntos finales asimtricos (continuos)
2) Observacin ms cercana (discreta)
3) Funcin de distribucin emprica (discreta)
4) Interpolados con puntos finales simtricos (continuos)
5) Funcin de distribucin con promediado (discreta)


196 Gua de referencia: Lista de funciones estadsticas

PAIRSTDDEV
Descripcin PAIRSTDDEV(Datos1,Datos2) calcula la desviacin
estndar de la muestra de las diferencias entre pares de
celdas de Datos1 y Datos2. Los clculos son slo de celdas
numricas. No se cuenta si falta un valor en cualquiera de
los rangos.
Ejemplos StatPairStdDev(A1:A100,B1:B100) calcula la desviacin
estndar de la muestra de las diferencias entre pares de
celdas numricas de los conjuntos de datos ubicados en
A1:A100 y B1:B100.
Reglas Datos1 y Datos2 deben ser rangos de Excel de igual
tamao.
Se seleccionan pares de celdas de Datos1 y Datos2 por filas,
comenzando en la parte superior izquierda.

PERCENTILE
Descripcin PERCENTILE(datos,p,IndicadorMtodo) calcula el percentil
p de los datos. Los percentiles se pueden calcular usando
cinco mtodos alternativos, que se pueden especificar
opcionalmente con el argumento IndicadorMtodo.
Ejemplos StatPercentile(A1:A100,.15,0) calcula el percentil 15 de los
datos situados en A1:A100. Los datos son continuos y usan
el mtodo de clculo de percentil de promedio clasificado.
Reglas p debe ser un valor 0-1, inclusivo
IndicadorMtodo es un argumento opcional que puede ser
un valor entero con un rango de -1 a 5. Este valor se
corresponde con el mtodo deseado para calcular el
percentil.
-1 o no especificado) Automtico (se basa en los datos de
entrada)
0) Igual que la Funcin de Percentil de Excel (continuos)
1) Interpolados con puntos finales asimtricos (continuos)
2) Observacin ms cercana (discreta)
3) Funcin de distribucin emprica (discreta)
4) Interpolados con puntos finales simtricos (continuos)
5) Funcin de distribucin con promediado (discreta)


Gua de referencia: Funciones de StatTools 197

PRODUCT
Descripcin PRODUCT(Datos1,Datos2,...DatosN) calcula el producto de
los datos especificados en Datos1,Datos2,...DatosN.
Ejemplos StatProduct(A1:A10,{1;2;3;2.4}) calcula el producto de
todos los valores del conjunto de datos que se encuentra
en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

QUARTILE
Descripcin QUARTILE(datos,q, IndicadorMtodo) calcula el cuartil
especificado de datos. Los cuartiles se pueden calcular
usando cinco mtodos alternativos, que se pueden
especificar opcionalmente con el argumento
IndicadorMtodo.
Ejemplos StatQuartile(A1:A100,1,FALSO) calcula el cuartil 1 de los
datos situados en A1:A100. Los datos son continuos.
Reglas datos deben ser un rango de Excel.
Q es el cuantil; 0=mnimo, 1=Cuartil 1, 2=Cuartil 2
(mediana), 3=Cuartil 3, 4=mximo.
IndicadorMtodo es un argumento opcional que puede ser
un valor entero con un rango de -1 a 5. Este valor se
corresponde con el mtodo deseado para calcular el
percentil.
-1 o no especificado) Automtico (se basa en los datos de
entrada)
0) Igual que la Funcin de Percentil de Excel (continuos)
1) Interpolados con puntos finales asimtricos (continuos)
2) Observacin ms cercana (discreta)
3) Funcin de distribucin emprica (discreta)
4) Interpolados con puntos finales simtricos (continuos)
5) Funcin de distribucin con promediado (discreta)

RAND
Descripcin RAND() genera un nmero aleatorio en el rango 0 a 1. Esta
funcin usa el generador de nmero aleatorio del producto
@RISK de Palisade y no el generador de nmero aleatorio
incorporado de Excel.
Ejemplos StatRand() Genera un nmero aleatorio en el rango 0 a 1.


198 Gua de referencia: Lista de funciones estadsticas

RANGE
Descripcin RANGE(Datos1,Datos2,...DatosN) calcula el rango (mximo
- mnimo) de los datos especificados en
Datos1,Datos2,...DatosN.
Ejemplos StatRange(A1:A100,{1;2;3;2.4}) calcula el rango (mximo -
mnimo) de los datos que se encuentra en A1:A100 y los
valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

RUNSTEST
Descripcin RUNSTEST(datos,corte) calcula la estadstica de
ejecuciones para los valores datos usando el valor corte.
Ejemplos StatRunsTest(A1:A100,MediaEstadstica(A1:A100)) calcula
la estadstica de prueba de ejecuciones de los datos
situados en A1:A100 usando la media de los datos como
valor de corte.
Reglas datos debe ser un rango de Excel.

SKEWNESS
Descripcin SKEWNESS(Datos1,Datos2,...DatosN) calcula la asimetra
de la muestra especificada en Datos1,Datos2,...DatosN.
Ejemplos StatSkewness(A1:A10,{1;2;3;2.4}) calcula la asimetra de la
muestra de todos los valores del conjunto de datos que se
encuentra en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

SKEWNESSP
Descripcin SKEWNESSP(Datos1,Datos2,...DatosN) calcula la asimetra
de la poblacin especificada en Datos1,Datos2,...DatosN.
Ejemplos StatSkewnessP(A1:A10,{1;2;3;2.4}) calcula la asimetra de
la poblacin de todos los valores del conjunto de datos que
se encuentra en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.


Gua de referencia: Funciones de StatTools 199

STANDARDIZE
Descripcin STANDARDIZE(x,media,desv_stn) calcula un valor
normalizado de una distribucin con la media especificada
y una desviacin estndar desv_estn. X es el valor a
normalizar.
Ejemplos StatStandardize(2,1,3) calcula un valor normalizado del
valor 2 de una distribucin con una media de 1 y una
desviacin estndar de 3.
Reglas x es el valor a normalizar
media es la media aritmtica de la distribucin.
desv_estn es la desviacin estndar de la distribucin.
Debe ser > 0.

STDDEV
Descripcin STDDEV(Datos1,Datos2,...DatosN) calcula la desviacin
estndar de la muestra especificada en
Datos1,Datos2,...DatosN.
Ejemplos StatStdDev(A1:A10,{1;2;3;2.4}) calcula la desviacin
estndar de la muestra de todos los valores del conjunto de
datos que se encuentra en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

STDDEVP
Descripcin STDDEVP(Datos1,Datos2,...DatosN) calcula la desviacin
estndar de la poblacin especificada en
Datos1,Datos2,...DatosN.
Ejemplos StatStdDevP(A1:A10,{1;2;3;2.4}) calcula la desviacin
estndar de la poblacin de todos los valores del conjunto
de datos que se encuentra en A1:A10 y los valores 1,2,3 y
2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.


200 Gua de referencia: Lista de funciones estadsticas

SUM
Descripcin SUM(Datos1,Datos2,...DatosN) calcula la suma de los datos
especificados en Datos1,Datos2,...DatosN.
Ejemplos StatSum(A1:A10,{1;2;3;2.4}) calcula la suma de todos los
valores del conjunto de datos que se encuentra en A1:A10
y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

SUMDEVSQ
Descripcin SUMDEVSQ(Datos1,Datos2,...DatosN) calcula la suma del
cuadrado de la desviacin de la media de sus argumentos,
que pueden ser nmeros, matrices o rangos Los nmeros
que faltan generan un blanco.
Ejemplos StatSumDevSq(A1:A10,{1;2;3;2.4}) calcula la suma del
cuadrado de la desviacin de la media de todos los valores
del conjunto de datos situados en A1:A10 y los valores 1,2,3
y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

SUMSQ
Descripcin SUMSQ(Datos1,Datos2,...DatosN) calcula la suma del
cuadrado de sus argumentos, que pueden ser nmeros,
matrices o rangos Los nmeros que faltan generan un
blanco.
Ejemplos StatSumSq(A1:A10,{1;2;3;2.4}) calcula la suma del
cuadrado de todos los valores del conjunto de datos que se
encuentra en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.


Gua de referencia: Funciones de StatTools 201

STUDENT
Descripcin STUDENT(grado_libertad, estadstica,valor) calcula la
estadstica de la distribucin T de Student introducida.
Ejemplos StatStudent(5,1,x a p,2) calcula el valor p de la
distribucin T de Student con 5 grados de libertad en un
valor x de 2.
Reglas grado_libertad es un nmero entero que indica el nmero
de grados de libertad. Debe ser un nmero del rango 1-
32767.
estadstica es un valor entero de 1 a 12 o una secuencia que
indica la estadstica que se va a generar. Para obtener ms
informacin consulte la seccin Funciones de Distribucin
al principio de este captulo.
x es el valor numrico en el que se evala la distribucin.
Debe ser >= 0.

VARIANCE
Descripcin VARIANCE(Datos1,Datos2,...DatosN) calcula la varianza
de la muestra especificada en Datos1,Datos2,...DatosN.
Ejemplos StatVariance(A1:A10,{1;2;3;2.4}) calcula la varianza de la
muestra de todos los valores del conjunto de datos que se
encuentra en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.

VARIANCEP
Descripcin VARIANCEP(Datos1,Datos2,...DatosN) calcula la varianza
de la poblacin especificada en Datos1,Datos2,...DatosN.
Ejemplos StatVarianceP(A1:A10,{1;2;3;2.4}) calcula la varianza de la
muestra de todos los valores del conjunto de datos que se
encuentra en A1:A10 y los valores 1,2,3 y 2.4.
Reglas Datos1,Datos2,...DatosN pueden ser nmeros, matrices o
rangos.


202




ndice 203

ndice
Acerca de, comando, 171
Activacin de licencia, comando,
171
Agrupar Variables, comando, 45
Anlisis Discriminatorio,
comando, 129
ANOVA de Dos Direcciones,
comando, 94
ANOVA de una direccin,
comando, 91
Autocorrelacin, comando, 111
Autorizacin, 171
Ayuda, 171
Barras de herramientas
StatTools, 25
Borrar Memoria del Cuadro de
Dilogo, comando, 170
Combinacin, comando, 58
Configuraciones de Aplicacin,
comando, 163
Correlaciones y Covarianza,
comando, 67
Desagrupar Variables, comando,
49
Descargar Complemento
StatTools, comando, 170
Desinstalacin de StatTools, 7
Diagrama de Cajas-Bigotes,
comando, 75
Diagrama de Dispersin,
comando, 73
Diagrama Normal, comando, 107
Diferencia, comando, 54
Eliminar Conjuntos de Datos,
comando, 170
Falso, comando, 60
Funciones de StatTools
StatCorrelationCoeff, 185
Funciones StatTools, 173
Lista alfabtica, 179
StatAutocorrelation, 183
StatAveDev, 183
StatBinomial, 183
StatCategoryIndices, 184
StatCategoryNames, 184
StatCategoryOccurrenceCount,
184
StatChiDist, 185
StatCount, 185
StatCountCategories, 186
StatCountCellByType, 186
StatCountRange, 186
StatCovariance, 187
StatCovarianceP, 187
StatCurtosis, 189
StatCurtosisP, 189
StatDestack, 187
StatDurbinWatson, 188
StatF, 188
StatGetCellValues, 188
StatLN, 189
StatMax, 189
StatMean, 190
StatMeanAbs, 190
StatMedian, 190
StatMin, 191
StatNormal, 191
StatPairCount, 192
StatPairMean, 192
StatPairMedian, 193
StatPairStdDev, 194
StatPercentile, 194
StatProduct, 195
StatQuartile, 195
StatRand, 195
StatRange, 196
StatRunsTest, 196
StatSkewness, 196
StatSkewnessP, 196
StatStandardize, 197

204

StatStdDev, 197
StatStdDevP, 197
StatStudent, 199
StatSum, 198
StatSumDevSq, 198
StatSumSq, 198
StatVariance, 199
StatVarianceP, 199
Grfica C, comando, 144
Grfica P, comando, 140
Grfica Pareto, comando, 133
Grfica U, comando, 147
Grficas X/R, comando, 136
Grfico de Series de Tiempo,
comando, 109
Histograma, comando, 70
Iconos
Escritorio, 7
StatTools, 25
Instrucciones para la instalacin,
67
Interaccin, comando, 56
Intervalo de confianza Media /
Desviacin Estndar, comando,
77
Intervalo de Confianza -
Proporcion, comando, 80
Mens
Men Ayuda (ventana
Modelo), 171
Men Estadsticas de Resumen,
64
Men Grficos de Resumen, 70
Men Inferencia estadstica, 77
Men Prueba de Normalidad,
99
Men Regresin y
Clasificacin, 120
Men Series de Tiempo y
Previsin, 109, 133, 151
Men Utilidades, 163
Men Utilidades de Datos, 45
Muestra Aleatoria, comando, 62
Palisade Corporation, 4
Previsin, comando, 115
Prueba de Ejecuciones para
Aleatoriedad, comando, 113
Prueba de Hiptesis - Proporcion,
comando, 86
Prueba de Independencia Chi-
Cuadrado, comando, 96
Prueba de Lillefors, comando,
104
Prueba de los signos de
Wilcoxon, comando, 156
Prueba de Mann-Whitney,
comando, 159
Prueba de Normalidad Chi-
cuadrado, comando, 100
Prueba del signo, comando, 153
Regresin Logstica, comando,
125
Regresin, comando, 120
Requisitos del sistema, 5
Resumen de Una Variable,
comando, 64
Retraso, comando, 52
Seleccin de tamao de la
muestra, comando, 89
Transformar Variables, comando,
50

También podría gustarte