Emilio Let ón Molina

Alej andro P. Marino
G- St at 2. 0
Pr ogr ama de Anál i si s Est adíst i cos
Manual del Pr ogr ama, Document aci ón y
Ej empl os
Ver sión del manual 2. 0
Base de Dat os
Est adíst ica Descript iva y de Est imación
Pruebas Est adíst icas
Epidemiología
Diagnóst ico
Técnicas Mult ivariant es
Gr áf icos
www.g- st at .es
www.e- biomet ria.com
2
Aut or es
Emilio Let ón Molina
Alej andro P. Marino
Dpt o. Biomet ría, GlaxoSmit hKline S. A. , Tres Cant os, Madrid
Edit a GlaxoSmit hKline S. A.
I SBN: 84- 607- 5171- 6. Regist ro Legal: M- 37418- 2002
Consul t or es i nf or mát i cos y est adíst i cos
Sacha Arozarena, Alfonso Palacios, Álvaro Trigo, Gema Núñez ( ASI , Madrid) ;
Llorenç Badiella ( Universit at Aut ònoma, Barcelona)
Condi ci ones de ut i l i zaci ón
La dist r ibución de est e pr ogr ama se r ealiza sobr e la base del concept o de
dist r ibución gr at uit a. Los pr opiet ar ios r enuncian a los der echos de
comer cialización aunque mant ienen los der echos de pr opiedad int elect ual e
indust r ial. La cesión libr e y gr at uit a de G- St at no incluye la cesión de los
derechos de propiedad del programa. Por ello los usurarios no podrán:
- Modificar los programas cont enidos en G- St at ni r ealizar ver sión alguna del
código f uent e por decompilación u ot r o mét odo.
- Alt erar, modificar o adapt ar la document ación, el programa o el aspect o de
l as pant al l as.
Los pr opiet ar ios no se hacen r esponsables de los daños y per j uicios, dir ect os o
indirect os, especiales o incident ales, que se deriven del uso y ut ilización,
debida o indebida, del pr ogr ama o de la document ación que se adj unt a. No se
per mit e la r epr oducción t ot al o par cial de est a publicación, ni su t r at amient o
inf or mát ico, ni la t r ansmisión de ninguna f or ma o por cualquier medio, ya sea
elect rónico, mecánico, por fot ocopia, por regist ro u ot ros mét odos, ni su
pr ést amo, alquiler o cualquier ot r a for ma de cesión de uso de est e Manual, sin
el per miso pr evio y por escr it o de los pr opiet ar ios del pr ogr ama.
Act ual i zaci ones de est e manual
En www. g- st at . es se encuent rán las versiones act ualizadas de est e manual.
Manual G- St at 2. 0 3
Cont eni do
Gener al i dades 9
Descr i pci ón 9
Requer imient os del equipo 9
I nst alación 9
Mej or as con r espect o a las ver siones 1. x 10
Not as sobr e el manual 12
Arranque de G- St at 13
Menú Pr i nci pal 1 5
Navegación 15
Bot ones 15
Menú Ar chi vo 1 7
Nuevo 17
Abrir Archivo 19
I nst r ucciones par a impor t ar ar chivos 20
Comienzo Rápido 20
Guar dar 20
Guar dar Como … 20
I mpr imir 22
Salir 22
Menú Edi t ar 2 3
Cor t ar 23
Copi ar 24
Pegar 24
4
Eliminar Variable / Regist ro 24
I nsert ar Variable 24
I nsert ar Regist ro 25
Or denar 25
Compact ar Tabla 25
Buscar 25
I r a Regist ro 26
Menú Ut i l i dades 2 7
Edit or de t ext o 27
Tr ansf or mar 27
Recodi f i car 28
Filt rar Dat os 29
Ej emplo 30
Menú Gr áf i cos 3 1
Bar r as ( a) 31
Hist ogr ama ( y) 32
Caj as ( y) 33
Ser ies Tempor ales ( y) 34
Bar r as ( a| b) 36
Caj as ( a| y) 37
Bloques de Medias y Desviaciones ( a| y) 38
Disper sión ( x| y) 39
Menú Descr i pt i va 4 1
Validación 41
Cualit at iva ( a) 42
Cualit at ivas ( a) ( b) 43
Cuant it at iva ( y) 43
Cuant it at ivas ( x) ( y) 48
Tabl as ( a| b) 4 9
Tabl as ( a| b) à Tablas 50
Manual G- St at 2. 0 5
Tabl as ( a| b) à Tablas. Dat os agr upados 54
Tabl as ( a| b| c) 56
Gr upos ( a| y) 57
Gr upos ( a* b| y) 58
Gr upos ( a* b* c| y) 60
Gr upos ( a| xyz) 60
x| y 61
Menú Anál i si s 6 7
Di st r i buci ones 6 7
Dist r ibuciones à Nor mal 68
Dist r ibuciones à Normal I nversa 68
Dist r ibuciones à t - St udent 68
Dist r ibuciones à t - St udent I nver sa 69
Dist r ibuciones à Chi- Cuadr ado 69
Dist r ibuciones à Chi- Cuadr ado I nver sa 69
Dist r ibuciones à F 70
Dist r ibuciones à F I nver sa 70
Dist r ibuciones à Rango Est udent izado I nver sa 71
Dist r ibuciones à Shapi r o Wi l k 71
Cual i t at i va ( a) 7 2
Cualit at iva ( a) à Una proporción 72
Cualit at iva ( a) à Una proporción. Dat os Agrupados 74
Cuant i t at i va ( y) 7 6
Cuant it at iva ( y) à Aj ust e 76
Cuant it at iva ( y) à t - St udent 79
Cuant it at iva ( y) à Chi- 2 par a una Desviación Típica 82
Cuant it at iva ( y) à t - St udent y Chi- 2 par a dt . Dat os Agr upados 84
Cuant it at iva ( y) à Rangos Signados 85
Cuant it at iva ( y) à Signos 87
Tabl as ( a| b) 9 0
Tabl as ( a| b) à Chi- Cuadrado 90
Tabl as ( a| b) à Chi- Cuadrado. Dat os Agrupados 92
Tabl as ( a| b) à Dos Proporciones. Dat os Agrupados 93
Tabl as ( a| b) à Chi- Cuadr ado de Tendencia Lineal ( y| b) 96
Tabl as ( a| b) à Chi- Cuadr ado de Tendencia Lineal. D. Agr up. ( y| b) 98
6
Tabl as ( a| b) à Fisher 100
Tabl as ( a| b) à Fisher. Dat os agrupados 101
Tabl as ( a| b) à McNemar 103
Tabl as ( a| b) à McNemar. Dat os Agrupados 105
Epi demi ol ogía ( b| b) 106
Epidemiología ( b| b) à Tablas 106
Epidemiología ( b| b) à Tablas. Dat os Agr upados 109
Epidemiología ( b| b) à Mant el- Haenszel. D. Agr upados ( c| ( b| b) ) 110
Di agnóst i co ( b| b) 116
Di agnóst i co ( b| b) à Tablas 116
Di agnóst i co ( b| b) à Tablas. Dat os Agr upados 121
Di agnóst i co ( b| b) à ROC ( y| b) 123
Dos Gr upos ( b| y) 125
Dos Gr upos ( b| y) à t - St udent 125
Dos Gr upos ( b| y) à t - St udent . Par eados 128
Dos Gr upos ( b| y) à F- Snedecor 130
Dos Gr upos ( b| y) à t - St udent y F- Snedecor . Dat os Agr upados 133
Dos Gr upos ( b| y) à Mann- Whit ney ( Wilcoxon) 135
Dos Gr upos ( b| y) à Wilcoxon. Pareados 139
Dos Gr upos ( b| y) à Signos. Par eados 141
Dos Gr upos ( b| y cens) 142
Dos Gr upos ( b| y cens) à Log- Rank 142
x | y 144
x| y à Regresión Lineal Simple 145
x| y à Modelos Transformados 151
x| y à Regr esión Polinómica 152
Menú Anova 157
Anova Un Fact or ( a| y) 157
Anova Un Fact or ( a| y) . Dat os Agr upados 168
Kr usk al - Wal l i s ( a| y) 170
Anova Un Fact or con Bl oque ( a bl oque| y) 173
Fr i edman ( a bl oque| y) 180
Anacova ( ax | y) 183
Anova Dos Fact or es ( ab| y) 191
Anova Fact or i al ( abc| y) 199
Manual G- St at 2. 0 7
Menú Mul t i var i ant e 207
Regr esi ón Múl t i pl e ( x z| y) 208
Regr esi ón Logíst i ca ( x z| b) 215
Regr esi ón de Cox ( x z| y cens) 220
Menú Ayuda 227
Manual del G- St at 227
Dónde Encont r ar 227
Acerca de G- St at 227
Bi bl i ogr af ía 229
8
Manual G- St at 2. 0 9
Gener al i dades
Descr i pci ón
El depar t ament o de Biomet r ía de GSK ha desar r ollado el pr ogr ama G- St at 2. 0,
un pr ogr ama complet o de análisis est adíst icos.
G- St at es un pr ogr ama est adíst ico que se ha desar r ollado en Java y que se
puede inst alar baj o Windows, Unix, Linux y Macint osh. Est á diseñado par a que
el usuario pueda realizar, de una forma rápida y fácil, análisis est adíst icos con
r esult ados t ant o gr áficos como numér icos. Par a el manej o del pr ogr ama no es
necesar io t ener amplios conocimient os est adíst icos. El pr ogr ama se manej a por
menús y no requiere programación. I ncluye base de dat os, gráficos, est adíst ica
descr ipt iva, t écnicas de est imación y pr uebas est adíst icas univar iant es y
bivariant es, paramét ricas y no paramét ricas, t écnicas de diagnóst ico y de
epidemiología. Asimismo, incluye t écnicas mult ivariant es esenciales como el
análisis de la varianza, regresión lineal múlt iple, regresión logíst ica y regresión
de Cox.
Requer i mi ent os del equi po
Los requisit os recomendados para que G- St at funcione de forma sat isfact oria
son:
- Pr ocesador Pent ium 350 MHz o similar
- 128 MB de memoria RAM
- 100 MB de espacio libr e en disco dur o
- Lect or de CD
- Pant alla VGA ( 1024 x 768) con 256 colores de resolución
- I mpresora configurada
I nst al aci ón
Ej ecut ar el archivo I nst all. ht m y seguir las inst rucciones. I nformación
act ualizada sobr e G- St at se encuent r a en:
www.g- st at .es
www. e- biomet r ia. com
10
Not a
G- St at es un programa mult isist ema operat ivo. Muchos
usuar ios encont r ar án car act er íst icas similar es a los
pr ogr amas en Windows, per o al ser una aplicación
pr ogr amada en Java su apar iencia y uso puede difer ir .
Mej or as con r espect o a l as ver si ones 1.x
Técni cas nuevas i ncor por adas
- Gr áficos de bloques de medias y desviaciones t ípicas.
- Series t emporales: gráficos, medias móviles, alisado exponencial, alisado
exponencial con doble par ámet r o de Holt - Wint er s.
- Est adíst icos de asociación par a dat os agr upados.
- Pr ueba z- pr opor ción par a dat os sin agr upar
- Prueba de Shapiro- Wilk.
- Levene.
- Chi- Cuadr ado par a dat os agr upados.
- Chi- Cuadrado de t endencia lineal.
- Chi- Cuadr ado de t endencia lineal par a dat os agr upados.
- Pr ueba de Fisher par a dat os agr upados.
- Pr ueba de McNemar par a dat os agr upados.
- Epidemiología par a dat os agr upados.
- Mant el- Haenszel par a dat os agr upados.
- Coeficient e Kappa de concordancia.
- Breslow- Day.
- Técnicas de Diagnóst ico.
- Diagnóst ico par a dat os agr upados.
- Cur vas ROC.
- Prueba de Log- Rank.
- Coeficient e de cor r elación int r aclase.
- Anova Un Fact or par a dat os agr upados.
- Compar aciones múlt iples a post er ior i no par amét r icas de Dunn.
- Regr esión Logíst ica hacia adelant e y hacia det r ás.
- Cox- Snell y Nagelker ke.
- Regr esión de Cox hacia adelant e y hacia det r ás.
I nst al aci ón
- I ncor por ación de un inst alador o asist ent e que per mit e la inst alación más
fácil en los principales sist emas operat ivos: Win, Mac, Linux y Unix.
Manual G- St at 2. 0 11
- Desapar ece la pant alla negr a cuando se inst ala en Windows.
Gener al
- Se ha incorporado un reloj para indicar que una t écnica se est á
pr ocesando.
- En los menús se incluyen pist as abr eviadas de ut ilización de las t écnicas.
- Se ha incorporado un bot ón de I mprimir en t odas las pant allas de
r esult ados.
- Se incluyen inst r ucciones par a impor t ar dat os de Excel y ot r os pr ogr amas.
- Cont r ol sobr e el númer o de decimales de cada var iable.
- Se han ampliado las ayudas “ on- line” del pr ogr ama en t odos los bot ones de
Ayuda.
- Avisos en oper aciones no adecuadas.
- Aument o de la robust ez: cont roles de funcionamient o para casos y ficheros
ext r emos.
Regr esi ón Li neal Múl t i pl e
- Se ha mej or ado la velocidad del cálculo de los r esiduos “ j acknife” .
Regr esi ón Logíst i ca
- Rediseño del código de pr ogr amación incor por ando opt imización en el
cálculo mat ricial del product o por mat rices diagonales para increment ar la
r api dez de su ej ecuci ón.
- Est andarización y desest andarización int erna de las variables para eliminar
er r or es de r edondeo.
- Separación del cálculo de la verosimilit ud para evit ar realizar operaciones
no fact ibles con logar it mos neper ianos.
- Se det ect an sit uaciones anómalas de conver gencia: separ ación y
cuasisepar ación.
- Se ha mej or ado el código par a asegur ar la conver gencia mediant e el
mét odo de “ half - st ep” .
- Nuevas opciones para realizar el modelo: con const ant e y sin const ant e,
selección en bloque , hacia delant e y hacia det r ás, punt o de cor t e, p- par a-
ent rar, p- para- salir, número máximo de it eraciones, most rar las
it er aciones, punt o de cor t e.
- Se incluyen las pr edicciones del modelo.
- Nuevos est adíst icos par a el t ér mino const ant e.
12
Regr esi ón de Cox
- Est andarización y desest andarización int erna de las variables para eliminar
er r or es de r edondeo.
- Separación del cálculo de la verosimilit ud para evit ar realizar operaciones
no fact ibles con logar it mos neper ianos.
- Se ha mej or ado el código par a asegur ar la conver gencia mediant e el
mét odo de “ half - st ep” .
- Nuevas opciones para realizar el modelo: selección en bloque, hacia
delant e y hacia det rás, punt o de cort e, p- para- ent rar, p- para- salir, número
máximo de it eraciones, most rar las it eraciones.
Cor r ecci ón de er r or es
- En el manej o de la base de dat os: inser t ar y eliminar r egist r os.
- Et iquet as e impr esión de los gr áf icos.
- Homogeneización ent r e clases e hist ogr amas.
- Dist ribución Normal para valores negat ivos.
- Cont r ast e de hipót esis de una pr opor ción.
- Rangos signados, Mann- Whit ney y Wilcoxon Par eados en sit uaciones
ext r emas.
- Fisher se ha cor r egido en el caso de que se ut ilice en su cálculo f act or iales
de númer os el evados.
- Se han cor r egido algunos er r or es en el cálculo de los est adíst icos D+ y D-
de Kolmogorov, aunque no afect aban al cálculo del p- valor Lilliefors
cor r egido.
- Et iquet a de los gr ados de liber t ad en el Anova Un Fact or con Bloques
- Regr esión Lineal Múlt iple sin const ant e hacia delant e y hacia det r ás.
Domi ni o Web Pr opi o
G- St at cuent a con dominio pr opio: www.g- st at .es donde se encuent r a
infor mación act ualizada del pr ogr ama.
Not as sobr e el manual
Est e manual no es un libro de est adíst ica. No se pret ende que los usuarios
aprendan est adíst ica con la información aquí cont enida. La principal función
consist e en pr opor cionar la for mulación empleada en la pr ogr amación.
Manual G- St at 2. 0 13
El Manej o del pr ogr ama es en su mayor par t e aut oexplicat ivo. En muchas
ocasiones, al igual que en el pr ogr ama se r epit en t écnicas, en est e manual la
infor mación es r edundant e, per o facilit a el manej o.
Mucha de la ayuda cont enida en est a manual est á incluida en los bot ones de
ayuda de las pant allas de r esult ados.
No se incluyen ej emplos en t odas las t écnicas, sólo en las que se ha
consider ado de más int er és o más didáct icas.
Como nor ma gener al conviene usar siempr e ficher os con al menos dos líneas
de dat os y que no haya var iables const ant es. Las opciones de Mult ivar iant e en
algunas ocasiones pueden t ar dar cier t o t iempo si hay muchos dat os.
Ar r anque de G- St at
El pr ogr ama G- St at es compat ible con ot r os pr ogr amas y est á validado en
modo mult it area. Sin embargo, los salvapant allas y los ant ivirus ( u ot ros
programas resident es) pueden provocar, ocasionalment e, errores de prot ección
gener al según la plat afor ma, el equipo y el soft war e con el que se est é
t r abaj ando.
Al ar r ancar el pr ogr ama apar ece la pant alla pr incipal, compuest a por Bar r a de
t ít ul o, Menú Pr i nci pal y Bar r a de I conos. Ést a es l a pant al l a par a l a
int r oducción y manej o de dat os.
Pant alla pr incipal del pr ogr ama.
Bar r a de t ít ul o: Est á si t uada en l a par t e super i or de l a vent ana y cont i ene el
nombr e del pr ogr ama.
Menú pr i nci pal : Est á debaj o de l a barra de t ít ulo. Ést e llevar á a los submenús
con las opciones pr incipales del pr ogr ama.
14
Bar r a de i conos: Se encuent r a después del menú principal y dispone de una
serie de iconos que permit en realizar ciert as operaciones direct ament e, sin
necesidad de ut ilizar los menús. Al posicionar el punt er o encima del icono se
ident if ica la opción.
Los iconos act ivan las siguient es opciones:
- Abrir Archivo
- Guardar Archivo
- Edit or de Text o
- Tr ansf or mar
- Ej emplo
- Validación
- Cont rast e de hipót esis de dos proporciones
- McNemar
- Chi- Cuadrado
- t - St udent
- Man- Whit ney ( Wilcoxon)
- Regresión Lineal Simple
- Kruskal- Wallis
- Anacova
- Anova Dos Fact or es
- Regresión Múlt iple
- Regresión Logíst ica
- Regr esi ón de Cox
- Manual de G- St at *
- Salir *
* Visible en pant allas super ior es a 17 pulgadas o r esoluciones super ior es a 800
x 600 pixeles.
Manual G- St at 2. 0 15
Menú Pr i nci pal
Navegaci ón
El menú pr incipal est á compuest o por submenús que cont ienen las funciones
más usuales de los pr ogr amas ut ilizados en Windows y aquellas que
pr opor ciona el pr ogr ama G- St at . El acceso a las opciones de los menús se
r ealiza por punt er o o mediant e combinaciones de t eclas. Todos los menús
cont ienen submenús.
La navegación por el programa permit e abrir simult áneament e varias vent anas.
Sin embar go, cualquier cambio en la vent ana de dat os no t iene ef ect o en las
vent anas de result ados abiert as. Para act ualizar los result ados hay que
act ualizar sus vent anas.
En muchas de las pant allas de r esult ados se encuent r an bot ones que abr en las
vent anas de opciones de análisis. El pr ogr ama no r ealiza las oper aciones si las
opciones no se confir man mediant e el bot ón Acept ar .
Las vent anas de result ados cont ienen pest añas con diferent es subanálisis.
Generalment e las opciones de las pest añas son independient es, de t al manera
que el usuar io debe confir mar en cada pest aña si las opciones son las
adecuadas y no confiar se en las opciones por defect o del pr ogr ama ni en
cambios pr evios.
Bot ones
En la mayor ía de las vent anas del pr ogr ama G- St at se encuent r an los
siguient es bot ones:
Acept ar : Cier r a la vent ana acept ando lo r ealizado.
Cancel ar : Cier r a la vent ana sin acept ar lo r ealizado.
Guar dar : Abr e el cuadr o de diálogo par a guar dar el gr áfico en un ficher o.
I mpr i mi r : Muest r a el cuadr o de diálogo de impr esión. I mpr ime el gr áfico.
Opci ones: Opciones r elacionadas con la t écnica est adíst ica o gr áfico.
Ayuda: Da infor mación complement ar ia par a int er pr et ación de r esult ados.
16
Manual G- St at 2. 0 17
Menú Ar chi vo
Act ivar la opción Ar chi vo del menú pr incipal o mediant e Alt + A. Est e menú
cont iene las opciones par a el manej o de la base de dat os.
Nuevo
Cr ea una nueva base de dat os vacía. Apar ece una pant alla que pr egunt a si se
desea guardar el archivo act ual. Después de acept ar , se abr i r á una vent ana
donde se t iene que int r oducir el númer o de casos ( Filas) y el númer o de
var iables ( Columnas) . Por defect o G- St at siempr e cr ea una base de dat os con
100 f ilas y 10 columnas. I nt r oducido el númer o de f ilas y columnas pulsar el
bot ón Acept ar.
Vent ana de def i ni ci ón de l a est r uct ur a de l a base de dat os nueva.
18
Ent r ada de dat os
Para int roducir los dat os de cada regist ro, hacer clic en la casilla
cor r espondient e. Par a mover se por la base de dat os ir dir ect ament e con el
punt ero o con los cursores del t eclado. Para edit ar cualquier valor hacer doble
clic en la casilla cor r espondient e.
• Disposición de los dat os
La hoj a de dat os est á est r uct ur ada en una cuadr ícula de filas y columnas: las
filas cor r esponden a los individuos o casos y las columnas a las var iables.
• Tipo de var iables
El programa admit e variables numéricas y alfanuméricas. Sin embargo, para la
r ealización de la mayor ía de las pr uebas y t écnicas est adíst icas se exige que las
variables sean numéricas. Es recomendable, por t ant o, la consignación de las
var iables como numér icas aunque su nat ur aleza sea nominal o dicot ómica. Es
posible recodificar valores de variables nominales o dicot ómicas mediant e la
opción " Recodificar" del menú " Ut ilidades" . El programa t rat a las variables
f echa como var iables nominales.
• Decimales
Se ut iliza el punt o como separ ador decimal. Se puede emplear t ant a pr ecisión
como se desee para cada variable. El número de decimales no t iene por qué
ser el mismo par a los difer ent es valor es numér icos de una var iable. Si por
er r or se emplea la coma o se impor t a un f icher o de dat os que emplea la coma
como separ ador decimal, los dat os ser án t r at ados como alfanumér icos.
• Valor es " Missing"
El programa admit e valores “ missing” o “ valores falt ant es” . Un valor missing en
una var iable no anula el r egist r o, except o en las t écnicas est adíst icas que
oper an simult áneament e con var ias var iables.
• Menú cont ext ual
El bot ón der echo act iva el menú cont ext ual en la hoj a de dat os act ivando las
opci ones:
- Cambiar Nombre
- Número de Decimales
- I nsert ar Variable
- Eliminar Variable
- Orden Ascendent e
- Orden Descendent e
- Recodif icar
Manual G- St at 2. 0 19
La mayor ía de est as opciones se encuent r an t ambién disponibles en los menús
“ Edit ar ” y “ Ut ilidades” .
• Format o
Es posible var iar la anchur a de las columnas sit uando y moviendo el cur sor
ent r e las líneas de separ ación de las var iables. El t ipo de var iable y el númer o
de decimales es r econocido aut omát icament e por el pr ogr ama.
• Edit ar un dat o
Hacer doble clic sobre la celda. El nuevo dat o sobreescribirá el ant iguo. Para
edit ar parcialment e un valor hacer doble clic y, t ras una pausa, hacer un clic
sobr e la celda. Par a añadir , hacer un solo clic sobr e la celda.
• Navegación
Ut ilizar las t eclas de posición para moverse por la cuadrícula. Alt ernat ivament e
ut ilizar el cur sor del r at ón y las t eclas de avance r ápido de página. Mediant e las
t eclas “ Ct r l- Fin” se posiciona en el f inal de la base de dat os. Mediant e las t eclas
“ Ct r l- I nicio” se posiciona en el comienzo de la base de dat os. La t ecla " Ent er "
mueve el cur sor a la celda inf er ior . El t amaño de la pant alla de la hoj a de dat os
es aj ust able mediant e los cur sor es act ivos en los lat er ales y en el ext r emo
infer ior der echo.
Abr i r Ar chi vo
( Ct r l+ O) . Est a opción per mit e abr ir ficher os mediant e el cuadr o de diálogo de
aper t ur a de f icher os. Al seleccionar est a opción aparecerá una pant alla que
pr egunt a si se desea guardar el archivo act ual.
En el cuadr o de diálogo Abrir archivo, se sel ecci ona l a uni dad, el di r ect or i o y el
nombr e de ficher o. Hecha la selección del ar chivo, pulsar el bot ón Acept ar e
int r oducir las car act er íst icas del ficher o.
Al abr ir una base de dat os, aut omát icament e, se cer r ar á el ficher o que est aba
act ivo hast a ese moment o.
El pr ogr ama cont iene una base de dat os " ej emplo" que se copia
aut omát icament e al r ealizar la inst alación y que se abr e mediant e el menú
Ut ilidades o mediant e el icono cor r espondient e.
20
I nst r ucci ones par a i mpor t ar ar chi vos
Par a impor t ar dat os desde Excel, r ealizar los siguient es pasos:
1. - Desde Excel, hacer Archivo / Guardar como: guardar como t ipo: t ext o
( delimit ado por t abulaciones) . Hay que t ener en cuent a que el separ ador
decimal debe ser el punt o en lugar de la coma. Est o se cambia en Menú de
I nicio / Configur ación / Panel de Cont r ol / Configur ación Regional / Pest aña:
Número / Campo: Signo Decimal.
2. - Abrir el archivo de t ext o con G- St at mediant e Archivo / Abrir Archivo.
Para import ar dat os desde Access, SPSS o cualquier ot ro programa, realizar los
siguient es pasos:
1. - Expor t ar los dat os a t ext o y seguir el paso 2 ant er ior o expor t ar los dat os a
Excel y seguir los pasos 1 y 2 ant er ior es.
Comi enzo Rápi do
Se incluye, a modo de ej emplo, los pasos que habr ía que seguir par a r ealizar la
pr ueba de compar ación de medias t - St udent . El obj et ivo de est e menú es
facilit ar una guía r ápida ( en un minut o) de las posibilidades del pr ogr ama.
Guar dar
( Ct r l+ G) . Guar da las últ imas modificaciones de la base de dat os que est á en
uso. Aparece el cuadro de diálogo de caract eríst icas del fichero. Seleccionadas
las caract eríst icas hacer clic en el bot ón Acept ar. Si l a base de dat os es nueva,
no est ar á guar dada aún y apar ecer á la vent ana de Guardar como.
Guar dar Como …
Guar da el f icher o en ot r a ubicación. Una vez elegidas las car act er íst icas del
ficher o, apar ece la vent ana Guardar como donde se sel ecci ona l a uni dad y el
dir ect or io donde se desea guar dar la base de dat os y su nombr e.
Manual G- St at 2. 0 21
: Guar dar l a base de dat os en ot r a ubi caci ón, por ej empl o, en Mi s
Document os.
Opciones de " Guar dar Como" con las car act er íst icas de los r egist r os.
Vent ana " Guar dar como" del pr ogr ama.
22
I mpr i mi r
( Ct r l+ P) . I mpr ime la base de dat os act iva. Se abr e la vent ana de impr esión del
sist ema oper at ivo ( S. O. ) . Se selecciona la impr esor a y el númer o de copias a
r ealizar .
Sal i r
( Alt + X) . Per mit e salir del pr ogr ama. Al salir del pr ogr ama se muest r a un
mensaj e por si se desea guar dar las últ imas modificaciones r ealizadas. Si se
selecciona el bot ón Sí, saldr á la vent ana de car act er íst icas de la base de dat os,
una vez r ealizada la selección se acept a y se sale de la aplicación. Con el bot ón
No, se sale dir ect ament e del pr ogr ama sin guar dar los cambios.
Manual G- St at 2. 0 23
Menú Edi t ar
Act ivar la opción Edi ci ón del menú pr incipal o mediant e Alt + E. Est e menú
cont iene las opciones r elat ivas a la edición de t ext o.
G- St at per mit e la edición y gr abación de dat os per o no es un pr ogr ama
especialment e diseñado para la gest ión avanzada de bases de dat os. Se
r ecomienda r ealizar las oper aciones pr evias en la base de dat os con ot r as
her r amient as más pot ent es, y una vez validada la base de dat os, expor t ar la a
G- St at mediant e su conversión en fichero t ext o separado por t abuladores
( opción r ecomendada) y con el nombr e de las var iables en pr imer a fila.
El pr ogr ama añade aut omát icament e filas vacías en la base de dat os cuando
se añaden o supr imen líneas ( r egist r os) . Est o no alt er a el funcionamient o del
programa ya que sólo considera los regist ros que cont ienen información en
alguna de las var iables.
Cor t ar
( Ct rl+ X) . Permit e cort ar uno o varios regist ros para eliminarlos de la base de
dat os act iva, par a inser t ar los en ot r as celdas de la base de dat os o par a
pegar los en ot r a base de dat os. Se inser t a o pega a t r avés de la opción Pegar .
Seleccionar la o las casillas a cor t ar . Act ivar la opción Cor t ar . Se bor r ar án los
r egist r os seleccionados y se copiar án en el por t apapeles.
24
Copi ar
( Ct r l+ C) . Per mit e r ealizar una copia de uno o var ios r egist r os par a pegar lo en
la misma base de dat os o en ot r a. Se seleccionan los r egist r os y se act iva la
opción Copiar . La infor mación se copiar á en el por t apapeles.
Pegar
( Ct l+ V) . Pega la infor mación guar dada en el por t apapeles. Se sit úa el cur sor en
la casilla donde se va a pegar el r egist r o. En el caso de que sea más de uno se
selecciona la pr imer a casilla.
El i mi nar Var i abl e / Regi st r o
Elimina uno o var ios r egist r os o var iables de la base de dat os. Los pasos a
seguir son los mismos en est as dos últ imas opciones, se selecciona con el
punt er o la( s) var iable( s) o r egist r o( s) a eliminar . Se act iva la opción
correspondient e y aparece un cuadro de diálogo para asegurar que se desea
eliminar la var iable o el r egist r o. Se pulsa Acept ar par a eliminar .
I nser t ar Var i abl e
I nser t a una var iable nueva a la base de dat os act iva. Se sit úa el cur sor en la
var iable ant er ior a la que se va inser t ar . Se selecciona la opción I nser t ar .
Apar ece una vent ana en la cual se t iene que int r oducir el nombr e de la nueva
var iable. Se cr ea la nueva var iable vacía.
: I nser t ar l a v ar i abl e FC1+ FC2 después de l a v ar i abl e FC2.
Se posiciona el cur sor en la var iable FC2FC1. Se selecciona la opción I nser t ar
Var i abl e.
Manual G- St at 2. 0 25
Vent ana I nser t ar Var iable.
Est o permit e nominar una nueva variable, pero los dat os se deberán grabar,
impor t ar o gener ar por la opción t r ansfor mación.
I nser t ar Regi st r o
I nser t a un nuevo r egist r o en la base de dat os abier t a. Se sit úa el cur sor en el
r egist r o siguient e al que se desea inser t ar . Se selecciona la opción I nser t ar
Regist r o. Se cr ea el nuevo r egist r o en blanco. Est a opción sir ve par a inser t ar
más de un r egist r o a la vez, señalando var ias filas en el mar cador a la
izquier da.
Or denar
Se coloca el punt er o en la var iable por la cual se quier e or denar la base de
dat os. Or dena de f or ma ascendent e o descendent e la base de dat os act iva en
r elación a la var iable seleccionada.
Compact ar Tabl a
Elimina los r egist r os vacíos int er medios de la base de dat os act iva. No elimina
los regist ros finales vacíos permanent ement e present es. Est os regist ros finales
vacíos no son nunca consider ados en los cálculos est adíst icos.
Buscar
Busca un valor en una var iable de la base de dat os abier t a. Colocar el cur sor
en la var iable donde se va a buscar el valor . Seleccionada la opción Buscar ,
apar ece un cuadr o de diálogo donde se int r oduce el valor a buscar . Pulsar el
bot ón Acept ar y el cur sor se sit uar á en el valor encont r ado, si no exist e dicho
26
valor , apar ecer á un cuadr o de diálogo que indica que no se ha encont r ado el
valor .
: I dent i f i car el r egi st r o del paci ent e que t i ene, en l a var i abl e
FC2 FC1 , el v al or 4 4 .
Vent ana Buscar.
I r a Regi st r o
Busca un r egist r o en la base de dat os act ual. Apar ece una vent ana donde se
int r oduce el númer o de or den del r egist r o a buscar . Al pulsar el bot ón Acept ar
se seleccionará el regist ro buscado. Si el regist ro no exist e aparece un cuadro
de diálogo que indica que el r egist r o int r oducido no es válido.
Manual G- St at 2. 0 27
Menú Ut i l i dades
Act ivar la opción Ut i l i dades del menú pr incipal o mediant e Alt + U. Est e menú
cont iene las opciones: abrir un edit or de t ext os independient e, modificar los
dat os mediant e t ransformaciones y recodificaciones, realización de filt ros de la
base de dat os y un ej emplo.
Edi t or de t ex t o
Abr e el edit or de t ext o del pr ogr ama. Al seleccionar est a opción apar ece el
edit or de t ext o del programa con un único menú, Ar chi vo. Di cho menú
cont iene las f unciones básicas par a el t r at amient o de f icher os: Nuevo, Abrir,
I nsert ar, Guardar, Guardar como, I mprimir y Salir . Para imprimir los result ados
del pr ogr ama, se puede copiar los pr eviament e al edit or o usar dir ect ament e el
bot ón I mpr imir en los r esult ados. Est a ut ilidad es similar al edit or de t ext o del
sist ema oper at ivo.
Tr ansf or mar
Permit e generar variables mediant e la t ransformación de variables numéricas
ya cr eadas. En la vent ana Transformar, apar ece un r ecuadr o con t odas las
variables cuant it at ivas de la base de dat os. La o las variables que se ut ilizan
par a la t r ansfor mación se llevar án a los r ecuadr os blancos. La t r ansfor mación
puede est ar compuest a por una var iable y un númer o. Se elige el operador a
ut ilizar del menú de los operadores y se ident ifica la variable.
Las t ransformaciones sobre dat os falt ant es ( “ missing” ) dan un result ado
falt ant e, incluso aunque las celdas dest ino est uviesen pr eviament e r ellenas.
28
: Ant er i or ment e se ha cr eado l a v ar i abl e FC1+ FC2, ahor a se desea
r el l enar l a con l a suma de l as v ar i abl es FC1 y FC2.
El r esult ado ser á la var iable FC1+ FC2.
Cuadro de diálogo Transformar.
Recodi f i car
Permit e cambiar aut omát icament e uno o varios valores, t ant o numéricos como
alfanumér icos, de una var iable. Colocar el cur sor en la var iable a r ecodificar ,
que puede ser t ant o cuant it at iva como cualit at iva. Aparece la vent ana de
r ecodif icar compuest a por dos columnas: Ant es, con los diferent es valores de la
var iable a r ecodificar y Después, donde inicialment e aparecen los mismos
valor es. En la columna Después se pueden ir definiendo las modificaciones de
los valor es o eliminar los si se desea. Par a que el pr ogr ama consider e t odas las
modificaciones hay que mover el cur sor a ot r a celda después de la últ ima
ent rada. Definidas las modificaciones, pulsar el bot ón Acept ar.
Manual G- St at 2. 0 29
: Se desea codi f i car l a v ar i abl e Sex o en 0 y 1, per o en l a base de
dat os apar ece est a v ar i abl e codi f i cada en 1 y 2. Se r ecodi f i car á l a
v ar i abl e de f or ma que donde ant es había un 1 se i nt r oduce un 0 y
donde había un 2 se i nt r oduce un 1.
Vent ana de la opción recodificar.
Fi l t r ar Dat os
Permit e seleccionar individuos a part ir de un rango específico correspondient e a
una var iable. Seleccionada la opción se muest r a la vent ana par a filt r ar dat os.
Se selecciona la var iable, la condición lógica ut ilizada par a filt r ar los dat os y el
valor del filt r o. Pulsar Acept ar par a finalizar .
: Se desea r eal i zar un subest udi o sól o con l as per sonas may or es de
22. 6 años. Se f i l t r ar án l os dat os según est a condi ci ón.
30
Vent ana de f ilt r ar dat os mediant e la var iable Edad.
Ej empl o
Abre una base de dat os que cont iene variables de diferent es t ipos y permit e la
r ealización de casi t odas las t écnicas y análisis est adíst icos del pr ogr ama.
Seleccionada la opción Ej emplo apar ece el cuadr o de diálogo de guar dar ,
aunque aún no se haya abier t o ninguna base de dat os.
El ej emplo incor por ado en el pr ogr ama se ut iliza en est e manual. El f icher o es
pulsofar6. gst , y se encuent r a en la car pet a de inst alación del pr ogr ama. El
fichero cont iene 40 regist ros correspondient es a ot ros t ant os suj et os. Las
var iables incluidas son:
I B: Númer o de ident ificación
Sex o: 1= Hombr e; 2= Muj er
Fumador : 1= sí; 2= no
Edad: Edad en años
FC1 : Fr ecuencia car diaca ant es del ej er cicio
FC2 : Frecuencia cardiaca después del ej ercicio
FC2FC1 : I ncr ement o de la fr ecuencia car diaca
St at us : Nivel de ent renamient o físico 1, 2 ó 3
Far maco: 1= Fármaco1; 2= Fármaco2
Los dat os son fict icios per o plausibles.
Manual G- St at 2. 0 31
Menú Gr áf i cos
Act ivar la opción Gr áf i cos del menú principal o mediant e Alt + G. Est e menú
cont iene las opciones necesar ias par a la r ealización de gr áficos. Las opciones
de est e menú est án separ adas en dos gr upos: gr áficos univar iant es y gr áficos
bivar iant es. Los códigos ( a) o ( b) indican que est e t ipo de gr áficos son
adecuados para variables cualit at ivas y los códigos ( y) o ( x) para variables
cuant it at ivas.
La separ ación por bar r as ver t icales indica un modelo que asume que las
var iables a la izquier da de la bar r a r epr esent an las var iables explicat ivas o
independient es y a la der echa la var iable r espuest a o dependient e.
Las pant allas de gr áficos t ienen cuat r o bot ones: Guardar, I mprimir, Opciones y
Ayuda.
Bar r as ( a)
Crea un gráfico de barras para una variable cualit at iva o discret a. Los gráficos
de bar r as se const r uyen de for ma que la longit ud / alt ur a de la bar r a
corresponde a la frecuencia absolut a para cada uno de los niveles de la
var iable. El or den y el color de las bar r as dependen de la disposición.
Manej o del programa
I dent ificar la var iable a analizar y act ivar la pest aña Bar r as donde apar ece el
gr áf ico de bar r as en una nueva vent ana.
32
Opciones:
- La cabecera, orient ación del gráfico, el t ít ulo del ej e X, su
escala ( absolut a/ frecuencias, relat iva/ porcent aj es) , mínimo,
máximo e incr ement o.
: Obt ener l a di st r i buci ón por sex os de l a base de dat os del
ej empl o.
Gr áfico de bar r as de la var iable Sexo del Ej emplo.
Hi st ogr ama ( y)
Cr ea un hist ogr ama par a una var iable cuant it at iva. El hist ogr ama, como paso
pr evio, discr et iza los valor es de la var iable en un númer o manej able de clases.
La al t ur a de cada bl oque en el hi st ogr ama depende del númer o de casos en
cada clase. En un hist ogr ama se puede ver clar ament e cuál es la dist r ibución
de los dat os. Nor malment e, par a el númer o de clases del hist ogr ama se t oma
la r aíz cuadr ada del númer o de casos.
Manej o del programa
I dent ificar la var iable a analizar . En la pest aña Hi st ogr ama se encuent r a la
vent ana con el hist ogr ama de la var iable.
Manual G- St at 2. 0 33
Opciones:
- La cabecera, los t ít ulos de los ej es X e Y, el mínimo y máximo
del ej e X.
- Númer o de clases en el que se quier a discr et izar la var iable:
Por def ect o 5. El pr ogr ama no admit e más de 12 clases.
: Obt ener el hi st ogr ama de l a v ar i abl e Edad con 8 cl ases.
Hist ogr ama de la var iable Edad.
Caj as ( y)
El diagr ama de caj as es un gr áfico que muest r a la dist r ibución de una var iable
cuant it at iva, represent ando una serie de medidas de cent ralización. Su
est r uct ur a est á for mada por una caj a, figur a r ect angular , y dos segment os
hor izont ales sit uados a ambos lados de ést a.
Los bordes de la caj a represent an los cuart iles 1º y 3º , respect ivament e, y la
mediana cor r esponde a la línea cent r al. Cuando la línea de la mediana se
superpone con alguna línea de los cuart iles, no es posible dist inguirla.
La media apar ece señalada con un cuadr ado gr is y suele encont r ar se pr óxima a
la mediana. La dist ancia ent re ambos valores, aport a información en cuant o a
la simet r ía o asimet r ía de la var iable. Cuando la var iable es simét r ica, media y
34
mediana coinciden. La dist ancia ent re est as dos medidas indica, asimismo, la
posibilidad de valores ext remos ya que la media es considerablement e sensible
a el l os y l a medi ana no.
Los valor es que est én sit uados a una dist ancia super ior a 1. 5 veces la
dist ancia int ercuart ílica ( diferencia ent re el t ercer y primer cuart il) son
consider ados “ out lier s” o valor es ext r emos y est án señalados en r oj o. Los
ext remos de los segment os corresponden al mínimo y al máximo de los valores
sin consider ar los valor es ext r emos. En el caso de que no haya valor es
ext r emos, los segment os son simplement e el mínimo y el máximo.
El nombr e de la var iable apar ece en el gr áf ico. Est e gr áf ico es aut oescalable,
pudiendo modificar se la r elación ent r e longit ud y anchur a de la vent ana
mediant e la posición del ext remo inferior derecho.
Posicionando el cur sor en cada punt o apar ecen las coor denadas.
Manej o del programa
I dent ificar la var iable a analizar . En la pest aña Caj as aparece el gráfico
de caj as de la var iable seleccionada.
Opciones:
- La cabecera, orient ación del gráfico, t ít ulo, mínimo, máximo e
incr ement o del ej e X.
Ser i es Tempor al es ( y)
Cr ea una ser ie t empor al t eór ica basada en los dat os de una var iable t iempo-
dependient e. Se r epr esent a los valor es de la var iable seleccionada en el ej e Y.
Se asume que los valor es de la var iable r epr esent ada en el gr áfico est án
or denados y que ést os est án igualment e espaciados en el t iempo, r epr esent ado
en el ej e X.
La ser ie pr edicha se r epr esent a como Y^ . En la gr áf ica se pr esent a el ECM
( Er r or Cuadr át ico Medio) , que se int er pr et a como una medida del er r or en la
pr edicción. A menor valor del ECM mej or es la ser ie est imada y más se acer ca
la modelización a los dat os r eales. El ECM viene dador por
∑ ·
2
t
e
n
1
ECM con
t t t
yˆ y e − ·
Manual G- St at 2. 0 35
Est a ser ie Y^ puede ser modelizada mediant e media móvil, alisado exponencial
y alisado exponencial doble. No calcula el gr áfico cuando la var iable analizada
t iene menos de cuat r o valor es.
Medi a móvi l
La media móvil de par ámet r o s se define como
s
y ... y y
M
1 s t 1 t t
t
+ − −
+ + +
·
t t
M yˆ ·
Al i sado ex ponenci al
El alisado exponencial de par ámet r o alfa se define como
( )
t t 1 t
y ˆ 1 y yˆ α − + α ·
+
1 1
y yˆ ·
Al i sado ex ponenci al dobl e de Hol t - Wi nt er s
El alisado exponencial doble de par ámet r os alfa y bet a se define como
( )( )
1 t 1 t t t
b M 1 y M
− −
+ α − + α · con
1 1
y M ·
( ) ( )
1 t 1 t t t
b 1 M M b
− −
β − + − β · con 0 b
1
·
h b M yˆ
t t h t
+ ·
+
con:
- Alfa: Det er mina el peso dado a las obser vaciones ult imas en r elación a las
obser vaciones ant er ior es. Se define ent r e 0 y 1. Valor es cer canos a 0 implican
que las obser vaciones ant er ior es cuent an t ant o como las más r ecient es.
Valores cercanos a 1 indican lo cont rario. Un valor de alfa igual a 1 indica que
solo cuent a la últ ima obser vación
- Bet a: Det er mina el peso dado a las obser vaciones ult imas en r elación a las
observaciones ant eriores en la est imación de la t endencia de la serie. Se define
ent r e 0 y 1. Valor es cer canos a 1 aument an el peso r elat ivo de las
obser vaciones más r ecient es.
36
Manej o del programa
I dent ificar la var iable a analizar . En la pest aña Ser i e Tempor al se encuent r an
dos ser ie de dat os, la or iginal y la t r ansf or mada.
Opciones:
- La cabecera, t ít ulo, mínimo, máximo e increment o del ej e Y.
- Tipo de serie t emporal: Media móvil de parámet ro S, alisado
exponencial de par ámet r o alfa y alisado exponencial de doble
par ámet r o alf a y bet a.
: Model i zar l a v ar i abl e FC1 con una ser i e t empor al de medi as
móv i l es de par ámet r o S= 4.
Ser ie t empor al con media móvil S= 4 de la var iable FC1.
Bar r as ( a| b)
Gener a un gr áfico de bar r as par a dos var iables cualit at ivas. Es una
represent ación gráfica de las frecuencias de las celdas en t ablas de frecuencias
conj unt as de dos var iables cualit at ivas / discr et as. Se ident ifican las dos
var iables en la vent ana de diálogo cor r espondient e como var iables “ r espuest a”
y “ explicat iva” , ambas cualit at ivas. La variable explicat iva corresponde a la
Manual G- St at 2. 0 37
variable que forma los grupos. La variable respuest a es la que formará los
bloques de frecuencias. Las alt uras de los bloques corresponden a las
f r ecuencias de cada combinación de niveles en las dos var iables.
Manej o del programa
Se ident if ica la Variable r espuest a y l a Variable explicat iva, amabas
cualit at ivas. En la pest aña Bar r as, se encuent r a el gr áfico de bar r as
bidimensional.
Opciones:
- La cabecera, orient ación del gráfico, el t ít ulo del ej e X, su
escala ( absolut a/ frecuencias, relat iva/ porcent aj es) , mínimo,
máximo e incr ement o.
Caj as ( a| y)
Cr ea un gr áfico de caj as par a una var iable cuant it at iva est r at ificada por una
variable cualit at iva. Es la represent ación gráfica de las dist ribuciones de
difer ent es submuest r as de una var iable cuant it at iva. Es necesar io ident ificar
dos variables: una explicat iva cualit at iva / discret a ( a) que es la que formará
las submuest r as, y ot r a r espuest a cuant it at iva ( y) de la que se analizan los
dat os. Par a cada nivel de la var iable que for ma las submuest r as se pr esent a un
di agr ama de caj as.
Manej o del programa
Se ident if ica la Variable r espuest a cuant it at iva y la Variable explicat iva
cualit at iva. En la pest aña Caj as se encuent ra el gráfico
cor r espondient e.
Opciones:
- La cabecera, orient ación del gráfico, t ít ulo, mínimo, máximo e
incr ement o del ej e X.
: Obt ener l as caj as de Edad según el Sex o de l os suj et os.
38
Gr áf icos de Caj as ( a| y) de la var iable Edad por Sexo.
Bl oques de Medi as y Desvi aci ones ( a| y)
Crea un gráfico de bloques para las medias y segment os para las desviaciones
t ípicas de los valor es de dif er ent es gr upos. La var iable r espuest a debe ser
cuant it at iva y la variable formadora de grupos cualit at iva.
Manej o del programa
Se ident if ica la Variable r espuest a cuant it at iva y la Variable explicat iva
cualit at iva. En la pest aña Bl oques de Medi as y Desvi aci ones se
encuent r a el gr áfico.
Opciones:
- La cabecer a, t ít ulo de los ej es X e Y, mínimo, máximo e
incr ement o del ej e Y.
- Desviaciones t ípicas o er r or est ándar .
: Repr esent ar l as medi as y desv i aci ones t ípi cas de l a v ar i abl e Edad
por gr upos de St at us.
Manual G- St at 2. 0 39
Bloques de medias y desviaciones t ípicas de Edad por St at us.
Di sper si ón ( x | y)
Repr esent ación de la nube de punt os en ej es car t esianos de dos var iables
cuant it at ivas.
Manej o del programa
Se int r oduce la Variable x y la Var iable y. En l a pest aña Di sper si ón se
encuent r a el gr áfico de disper sión de ambas var iables.
Opciones:
- La cabecera, t ít ulos, mínimo, máximo e increment o de los
ej es X e Y.
Par a la obt ención de la r ect a de r egr esión y de sus límit es
confidenciales, acceder a los menús “ Descr ipt iva / x| y” y “ Análisis/
x| y” .
40
Manual G- St at 2. 0 41
Menú Descr i pt i va
Act ivar la opción Descr i pt i va del menú pr incipal o mediant e Alt + D. Est e
menú, cont iene las opciones necesarias para la realización de análisis
descript ivos. Est án separadas en seis grupos: validación, descript iva de
variables cualit at ivas, descript iva de variables cuant it at ivas, t ablas, descript iva
por gr upos y r elación ent r e dos var iables cuant it at ivas. Los códigos ( a) o ( b)
indican variables cualit at ivas y los códigos ( y) , ( x) o ( z) indican variables
cuant it at ivas.
El ast erisco implica que los result ados se est rat ificarán para t odas las posibles
combinaciones de cat egor ías o niveles de las var iables explicat ivas.
Val i daci ón
Se pr esent a un r esumen básico de las var iables que componen el ficher o de
t r abaj o en t ér minos de númer o de casos y de var iables así como el númer o de
casos válidos y casos numéricos, mínimo y máximo. Est a descript iva sirve de
comprobación para det ect ar posibles errores en la ent rada de dat os. Para una
descr ipt iva más pr ecisa conviene usar el menú Descr ipt iva / Cualit at ivas ( a) ( b)
42
para variables cualit at ivas y el menú Descript iva / Cuant it at ivas ( x) ( y) para
var iables cuant it at ivas.
: Real i zar l a val i daci ón de l a base de dat os del Ej empl o
Vent ana de r esult ado al seleccionar validación en la base de dat os del ej emplo.
Validación de Variables
====================================================================
Número de Casos: 40
Casos Casos
Variable Válidos Numéricos Mínimo Máximo
----------------------------------------------------------
IB 40 40 1.0 40.0
SEXO 40 40 1.0 2.0
FUMADOR 40 40 1.0 2.0
EDAD 40 40 19.5 25.6
FC1 40 40 62.0 96.0
FC2 40 40 112.0 165.0
FC2FC1 40 40 42.0 82.0
STATUS 40 40 1.0 3.0
FARMACO 40 40 1.0 2.0
Cual i t at i va ( a)
Realiza la descript iva para una variable cualit at iva o discret a ( a) .
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable cualit at iva o discr et a a analizar .
Fr ecuenci as: Los principales est adíst icos descript ivos para variables
cualit at ivas son: las frecuencias absolut as y las frecuencias relat ivas.
Par a cada cat egor ía de la var iable cualit at iva se muest r a el númer o de
individuos que per t enecen a ella ( fr ecuencias absolut as) , así como el
porcent aj e respect o al t ot al de individuos ( frecuencias relat ivas) .
Bar r as: Gr áfico de bar r as par a una var iable cualit at iva. Ver menú
Gr áf i cos.
Manual G- St at 2. 0 43
Cual i t at i vas ( a) ( b)
Realiza la descr ipt iva par a una o var ias var iables cualit at ivas o discr et as.
Manej o del programa
Var i abl es: Se ident if ican las Variables cualit at ivas o discr et as.
Fr ecuenci as: Per mit e obt ener una descr ipt iva en t ér minos de
fr ecuencias par a var ias var iables cualit at ivas a la vez. En cada var iable,
para cada cat egoría se muest ra el número de individuos que
pert enecen a ella ( frecuencias absolut as) , así como el porcent aj e
respect o al t ot al de individuos ( frecuencias relat ivas) .
Cuant i t at i va ( y)
Realiza la est adíst ica descript iva para una variable cuant it at iva. Los principales
est adíst icos descript ivos para una variable cuant it at iva son: media arit mét ica,
mediana, moda, media geomét r ica, var ianza, desviación t ípica, er r or est ándar
de la media, mínimo, máximo, rango o amplit ud, cuart iles, rango
int ercuart ílico, coeficient e de asimet ría, coeficient e de asimet ría est andarizada,
coeficient e de curt osis, coeficient e de curt osis est andarizada y coeficient e de
var iación.
La medi a ar i t mét i ca se calcula como la suma de los valor es de las
observaciones dividido por el t amaño muest ral ( n) :
n
x
x
n
1 i
i

·
·
La medi ana ( med) se calcula or denando los dat os de menor a mayor y
t omando el val or del medi o que es el que dej a un 50% de obser vaci ones a su
izquier da y un 50% a su der echa. En el caso de que el númer o de
observaciones sea par, la mediana se calcula como la semisuma de los dos
valor es cent r ales.
La moda es el valor que más se r epit e. Tiene sent ido en var iables con pocos
ni vel es.
La medi a geomét r i ca ( mg) se calcula como la r aíz enésima del pr oduct o de
los valor es de las obser vaciones, con
44
n
1
n
1 i
i
n
n
1 i
i
x x mg

,
`

.
|
∏ · ∏ ·
· ·
Ot ra expresión para su cálculo es evaluar la exponencial de la media arit mét ica
de los logar it mos neper ianos de las obser vaciones. Cuando exist an valor es
negat ivos, el programa devuelve el valor “ No Aplicable” para la media
geomét r ica.
La var i anza se calcula como
( ) ∑ −

·
·
n
1 i
2
i
2
x x
1 n
1
s
La desvi aci ón t ípi ca o desviación est ándar s se calcula como la r aíz cuadr ada
posit iva de la var ianza de f or ma que
( ) ∑ −

+ · + ·
·
n
1 i
2
i
2
x x
1 n
1
s s
El er r or est ándar de la media se ut iliza par a est imar una media poblacional
mediant e int er valos de conf ianza. Su expr esión es la desviación t ípica dividida
ent re la raíz cuadrada del t amaño muest ral.
El míni mo es el menor valor obser vado, el máx i mo es el mayor val or
obser vado y la ampl i t ud ( a veces llamada r ango) es la dif er encia ent r e el
máximo y el mínimo.
Exist en t r es cuar t i l es: cuart il inferior, cuart il medio y cuart il superior. El cuart il
inf er ior se calcula or denando los dat os de menor a mayor y t omando el valor
que dej a un 25% de obser vaciones a su izquier da y un 75% a su der echa. El
cuart il medio es la mediana. El cuart il superior es aquel valor, que en los dat os
or denados, dej a un 75% a su izquier da y un 25% a su der echa. El r ango
i nt er cuar t íl i co es la difer encia ent r e el cuar t il super ior y el infer ior .
El coef i ci ent e de asi met r ía se calcula como
( )( )
( ) ∑ −
− − ·
n
1 i
3
i
3
x x
s
1
2 n 1 n
n
El coef i ci ent e de asi met r ía est andar i zada vi ene dado por
n
6
asimet r ía
El coef i ci ent e de cur t osi s ( apunt amient o) se calcula como
Manual G- St at 2. 0 45
( )
( )( )( )
( )
( )( )
( )( ) 3 n 2 n
1 n 1 n
3 x x
s
1
3 n 2 n 1 n
1 n n
n
1 i
4
i
4
− −
− −
− ∑ −
− − −
+
·
El coef i ci ent e de cur t osi s est andar i zada vi ene dado por
n
24
cur t osi s
El coef i ci ent e de var i aci ón se calcula como
x
s
Los per cent i l es son aquellos valor es que dej an un p% de obser vaciones a un
lado de su valor y un ( 1- p) % al ot ro, siendo p un número cualquiera ent re cero
y uno. Sea n el t amaño muest r al, el per cent il p se calcula como:
( )
) 1 i ( ) i (
x x
2
1
+
+ si f = 0
) 1 i (
x
+
si f > 0
siendo i la part e ent era de n· p y f la part e fraccional de n· p, y donde ( i) indica
el valor or denado de los valor es de la var iable x de menor a mayor que ocupa
la posición i- ésima.
Por ej emplo si n= 40 y p= 25%, se t iene que i= 10 y f= 0. Si n= 39 y p= 50%, se
t iene que i= 19 y f= 0. 5.
Obser var que si n es par , la mediana ( per cent il 50%) se calcula como la
semisuma de los dos valor es cent r ales y que si n es impar como el valor que
dej a a la izquier da y a la der echa el mismo númer o de valor es.
Ej emplos de percent iles son los deciles y los cuart iles. Los deciles son los
per cent iles en donde p= 0. 1, 0. 2, 0. 3, 0. 4, 0. 5, 0. 6, 0. 7, 0. 8, 0. 9. Los cuar t iles
son los percent iles en donde p= 0. 25, 0. 50, 0. 75. Al cuart il p= 0. 25 se le conoce
como cuar t il infer ior o pr imer cuar t il Q1, al cuar t il p= 0. 75 como cuar t il super ior
o t er cer cuar t il Q3. La mediana es el segundo cuar t il Q2.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable cuant i t at i va.
46
Est adíst i cos: Pr esent a los est adíst icos seleccionados par a est a
var i abl e.
Opciones:
- Seleccionar los est adíst icos a visualizar : por defect o apar ecen
t odos.
Caj as: Gr áfico de Caj as de la var iable cuant it at iva. Ver menú Gr áficos.
Cl ases: Con est a opción se discret iza la variable cuant it at iva en
dist int os t r amos o int er valos. Par a cada uno de ellos se suminist r a
infor mación en t ér minos de fr ecuencias absolut as y r elat ivas. Las
frecuencias absolut as indican el número de individuos para cada
int ervalo, las relat ivas la proporción respect o al t ot al.
Opciones:
- Númer o de clases: Por defect o el pr ogr ama consider a 5
clases.
Hi st ogr ama : Hist ogr ama par a una var iable cuant it at iva. Ver menú
Gr áf i cos.
Per cent i l es: Pr esent an como opción por def ect o, los per cent iles del
1%, 5%, 10%, 25%, 75%, 90%, 95% y 99%.
: Real i zar un anál i si s descr i pt i v o de l a v ar i abl e FC2FC1.
Est adíst icos de la variable FC2FC1 con la opción Cuant it at iva ( y) .
Estadísticos para la variable FC2FC1
======================================================================
---------------------------------------
Estadístico FC2FC1
---------------------------------------
N 40
Media 61.7500
Mediana 61.0000
Moda 52.0000
Media Geométrica 60.7718
Varianza 120.5000
Desviación Típica 10.9772
E.E. de la Media (*) 1.7357
Mínimo 42.0000
Máximo 82.0000
Manual G- St at 2. 0 47
Rango 40.0000
Cuartil Inferior 53.0000
Cuartil Superior 70.0000
Rango Intercuartílico 17.0000
Asimetría -0.0168
Asimetría Estandarizada -0.0433
Curtosis -0.8432
Curtosis Estandarizada -1.0885
Coeficiente de Variación 17.7769
---------------------------------------
(*) Usar con propósito de estimación para el I.C. de la media
Caj as de la variable FC2FC1 de la opción Cuant it at iva ( y) .
Clases de la variable FC2FC1
======================================================================
Número de Casos: 40
---------------------------------------------------------------------
Límite Límite Frec. Frec. Abs.Frec. Frec. Rela.
Clases Inferior Superior Absoluta Acumulada Relativa Acumulada
---------------------------------------------------------------------
1 42.00 50.00 6 6 0.15 0.15
2 50.00 58.00 7 13 0.17 0.32
3 58.00 66.00 11 24 0.28 0.60
4 66.00 74.00 9 33 0.23 0.82
5 74.00 82.00 7 40 0.17 1.00
---------------------------------------------------------------------
48
Hist ogr ama de la opción Cuant it at iva ( y) par a FC2FC1.
Per cent iles de la var iable FC2FC1.
Percentiles para la variable FC2FC1
===================================================================
Número de Casos: 40
Percentiles
1.0% 42.00
5.0% 43.00
10.0% 47.00
25.0% 53.00
75.0% 70.00
90.0% 76.00
95.0% 80.00
99.0% 82.00
Cuant i t at i vas ( x ) ( y)
Realiza la est adíst ica descr ipt iva par a var ias var iables cuant it at ivas.
Manej o del programa
Var i abl es: Se ident ifican las Variables a analizar .
Manual G- St at 2. 0 49
Est adíst i cos: Est adíst icos de las variables seleccionadas. Se det allan
en Cuant it at iva ( y) .
Cor r el aci ones: Mat r iz de cor r elaciones de Pear son y Spear man de las
variables seleccionadas considerando los casos válidos. Ver Descript iva
/ x| y / Modelo par a las definiciones de dichos coeficient es y Análisis /
x| y / Modelo par a ver cómo se calculan sus signif icaciones.
: Se desea cal cul ar l os coef i ci ent es de cor r el aci ón de Pear son de
l os dat os del ej empl o par a l as v ar i abl es FC1, FC2 y Edad.
Mat r iz de coeficient es de cor r elación de las var iables FC1, FC2 y Edad.
Cuantitativas (x)(y). Correlaciones
=========================================================================
Variables : FC1, FC2, EDAD
Número de Casos : 40
r de Pearson
(Significación)
FC1 FC2 EDAD
-------------------------------------------
FC1 1.0000 0.5796 0.1848
(0.0001) (0.2537)
FC2 0.5796 1.0000 -0.6437
(0.0001) (0.0001)
EDAD 0.1848 -0.6437 1.0000
(0.2537) (0.0001)
-------------------------------------------
Tabl as ( a| b)
Cont iene un submenú par a var iables cualit at ivas con dat os no agr upados y
agr upados.
50
Tabl as ( a| b) à Tabl as
Present a una t abla de cont ingencia para dos variables cualit at ivas o discret as y
los est adíst icos descr ipt ivos asociados.
En las t ablas de cont ingencia, se r ecoge la fr ecuencia absolut a del númer o de
individuos para cada una de las posibles combinaciones de niveles de las dos
variables. Est as frecuencias absolut as se pueden relat ivizar respect o al t ot al de
cada nivel en cada var iable ( por cent aj e de filas y columnas) o r espect o al t ot al
de individuos ( porcent aj e t ot al) .
Se muest r an los pr incipales est adíst icos de asociación ent r e dos var iables
cualit at ivas: los est adíst icos de asociación y los est adíst icos con modelo.
La not ación que se sigue es la de una mat r iz con r filas y c columnas donde:
Var. en columnas= var X
Var. en filas= var Y Cat 1 Cat 2 … Cat c Tot al
Niv1 n
11
n
12
… n
1c
r
1
Niv2 n
21
n
22
… n
2c
r
2
… … … … … …
Nivr n
r1
n
r2
… n
rc
r
r
Tot al c
1
c
2
… c
c
n
Los est adíst icos de asociación que se t r at an son: V de Cr amer , coef icient e de
cont ingencia C, lambda simét r ica λ
sim
, coeficient e de incert idumbre simét rico
U
sim
, Gamma de Goodman- Kr uskal
k
G
γ , Tau- b de Kendall, Tau- c de St uar t y
D
sim
de Somer simét r ico. Los est adíst icos con modelo que se t r at an son:
lambda asimét r ica λ
asim
, coeficient e de incer t idumbr e asimét r ico U
asim
y D
asim
de
Somer asimét r ico.
En el caso de que haya al menos una var iable cualit at iva sólo se muest r an los
siguient es est adíst icos: V de Cramer, coeficient e de cont ingencia C, lambda
simét r ica λ
sim
, coef icient e de incer t idumbr e simét r ico U
sim
, lambda asimét rica
λ
asim
y coef icient e de incer t idumbr e asimét r ico U
asim
. En el caso de que las dos
var iables sean cuant it at ivas se muest r an t odos los est adíst icos consider ados.
Manual G- St at 2. 0 51
V de Cr amer
{ ¦ 1 c , 1 r mín
n
V
2
− −
χ
+ ·
donde χ
2
es el valor del est adíst ico de cont r ast e Chi- Cuadr ado par a una t abla
de dimensiones r x c ( ver Análisis / Tablas ( a| b) / Chi- Cuadr ado / Chi-
Cuadrado) .
Coef i ci ent e de cont i ngenci a C
n
C
2
2
+ χ
χ
+ ·
Lambda si mét r i ca λ
si m
i
i
j
j
i
i
j
j
j
ij
i
i
ij
j
sim
r máx c máx n 2
r máx c máx n máx n máx
− −
− − ∑ + ∑
· λ
Coef i ci ent e de i ncer t i dumbr e si mét r i co U
si m
[ ]
[ ] ) y ( H ) x ( H
) xy ( H ) y ( H ) x ( H 2
U
sim
+
− +
· con

,
`

.
|
− ·
·
r
1 i
i i
n
r
Ln
n
r
) x ( H

,
`

.
|
− ·
·
c
1 j
j j
n
c
Ln
n
c
) y ( H

,
`

.
|
∑ − ·
· ·
r
1 i
ij
c
1 j
ij
n
n
Ln
n
n
) xy ( H
Gamma de Goodman- Kr usk al
Gk
γ
' Q ' P
' Q ' P
K
G
+

· γ con
∑ ∑ ·
i j
ij ij
A n ' P
52
∑ ∑ ∑ ∑ + ·
> > < < i k j l i k j l
kl kl ij
n n A
∑ ∑ ·
i j
ij ij
D n ' Q
∑ ∑ ∑ + ∑ ·
> < > < i k i k j l
kl
j l
kl ij
n n D
Tau- b de Kendal l
b
τ
( ) ( ) ( ) ( )
]
]
]

∑ − − −
]
]
]

∑ − − −

· τ
j
j j
i
i i
b
1 c c 1 n n 1 r r 1 n n
' Q ' P
Tau- c de St uar t
c
τ
m
1 m
n
' Q ' P
2
c


· τ con m= mín { r, c}
Coef i ci ent e D de Somer si mét r i co
c r
sim
w w
' Q ' P
2 D
+

⋅ · con
∑ − ·
i
2
i
2
r
r n w
∑ − ·
j
2
j
2
c
c n w
Lambda asi mét r i ca λ
asi m
Suponiendo que la variable fila es la variable respuest a, es
i
i
i
i
j
ij
i
asim
r máx n
r máx n máx

− ∑
· λ
y suponiendo que la variable columna es la variable respuest a, es
Manual G- St at 2. 0 53
j
j
j
j i
ij
j
asim
c máx n
c máx n máx

− ∑
· λ
Coef i ci ent e de i ncer t i dumbr e asi mét r i co U
asi m
Suponiendo que la variable fila es la variable respuest a, es
) x ( H
) xy ( H ) y ( H ) x ( H
U
asim
− +
·
y suponiendo que la variable columna es la variable respuest a, es
) y ( H
) xy ( H ) y ( H ) x ( H
U
asim
− +
·
Coef i ci ent e D de Somer asi mét r i co
Suponiendo que la variable fila es la variable respuest a, es
c
asim
w
' Q ' P
D

·
y suponiendo que la variable columna es la variable respuest a, es
r
asim
w
' Q ' P
D

·
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable que apar ecer á en f ilas y la Variable
que apar ecer á en columnas.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas. En cada celda apar ece en t ér minos absolut os el númer o de
individuos dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
54
Est adíst i cos: Se muest r an los pr incipales est adíst icos de asociación
ent r e dos var iables cualit at ivas:
V de Cr amer
Coef icient e de Cont ingencia
Lambda simét r ica
Coeficient e de incer t idumbr e simét r ico
Gamma de Goodman- Kr uskal
Tau- b de Kendall
Tau- c de St uar t
D de Somer simét r ico
También se pr esent an los siguient es est adíst icos descr ipt ivos cuando se
asume un modelo
Lambda asimét rica
Coeficient e de incer t idumbr e asimét r ico
D de Somer asimét r ico
Bar r as: Repr esent ación gr áfica de las fr ecuencias de las celdas en
t ablas de frecuencias conj unt as de dos variables cualit at ivas / discret as.
Se ident ifican las dos var iables en la vent ana de diálogo
correspondient e como variables “ fila” y “ columna” . La variable fila
corresponde a la variable que forma los grupos. La variable columna es
la que formará los bloques de frecuencias. Las alt uras de los bloques
cor r esponden a las fr ecuencias de cada combinación de niveles en las
dos var iables.
Opciones:
- La cabecera, orient ación del gráfico, el t ít ulo del ej e X, su
escala ( absolut a/ frecuencias, relat iva/ porcent aj es) , mínimo,
máximo e incr ement o.
Tabl as ( a| b) à Tabl as. Dat os agr upados
A par t ir de dat os agr upados se calculan los est adíst icos descr ipt ivos asociados
par a dos var iables cualit at ivas o discr et as. Los dat os agr upados se int r oducen
dir ect ament e en una cuadr ícula en for ma de t abla de r filas y c columnas. Los
fundament os t eór icos y la for mulación son idént icos a los pr esent ados en la
opción de análisis ant er ior con dat os a par t ir de un f icher o.
Manual G- St at 2. 0 55
Manej o del programa
Dat os Agr upados: La cuadr ícula per mit e la ent r ada dir ect a de las
fr ecuencias. Se puede definir el númer o de cat egor ías o niveles de las
dos variables mediant e el número de filas y columnas. Por defect o
apar ecen unos valor es que deben ser sust it uidos por los dat os del
usuar io.
No dej ar filas o columnas con valores falt ant es o con t odos los valores
cer o. El Bot ón " Cr ear Tabla" pr epar a la est r uct ur a de la t abla aj ust ada
al número de filas y columnas definido. La t abla no admit e valores
negat ivos, decimales o alfanumér icos.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas. En cada celda apar ece en t ér minos absolut os el númer o de
individuos dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Est adíst i cos: Se muest r an los pr incipales est adíst icos de asociación
ent r e dos var iables cualit at ivas:
V de Cr amer
Coef icient e de Cont ingencia
Lambda simét r ica
Coeficient e de incer t idumbr e simét r ico
Gamma de Goodman- Kr uskal
Tau- b de Kendall
Tau- c de St uar t
D de Somer simét r ico
También se pr esent an los siguient es est adíst icos descr ipt ivos cuando se
asume un modelo
Lambda asimét rica
Coeficient e de incer t idumbr e asimét r ico
D de Somer asimét r ico
Bar r as: Repr esent ación gr áfica de las fr ecuencias de las celdas en
t ablas de frecuencias conj unt as de dos variables cualit at ivas / discret as.
56
Se ident ifican las dos var iables en la vent ana de diálogo
correspondient e como variables “ fila” y “ columna” . La variable fila
corresponde a la variable que forma los grupos. La variable columna es
la que formará los bloques de frecuencias. Las alt uras de los bloques
cor r esponden a las fr ecuencias de cada combinación de niveles en las
dos var iables.
Opciones:
- La cabecera, orient ación del gráfico, el t ít ulo del ej e X, su
escala ( absolut a/ frecuencias, relat iva/ porcent aj es) , mínimo,
máximo e incr ement o.
Tabl as ( a| b| c)
Present a t ablas de frecuencias para dos variables cualit at ivas, est rat ificadas
por una t er cer a var iable cualit at iva que f or ma las capas.
Permit e realizar un análisis est rat ificado mediant e varias t ablas de cont ingencia
de las var iables a y b par a cada uno de los valor es de la var iable c ( la que
forma las capas) . En cada celda aparece en t érminos absolut os el número de
individuos dent ro de cada posible combinación de cat egorías. Adicionalment e
se present an los porcent aj es de dichos valores con relación al número t ot al de
individuos en una cat egor ía en fila ( por cent aj es fila) , en una cat egor ía en
columna ( porcent aj es columna) y del t ot al de individuos ( porcent aj e t ot al) .
Manej o del programa
Var i abl es: Se ident ifican las dos var iables que for mar án las t ablas,
ident ificando la Variable que apar ecer á en f ilas y la Variable que
aparecerá en columnas. Adicionalment e se ident ifica una t ercera
Variable cualit at iva f or mador a de las capas o est r at os. Sólo apar ecen
los r egist r os complet os par a est as t r es var iables.
Tabl as: Apar ece el númer o t ot al de casos válidos no falt ant es y var ias
t ablas cr uzadas de las var iables seleccionadas en filas y columnas, par a
cada nivel de la var iable en capas. En las t ablas apar ecen las
f r ecuencias absolut as y los por cent aj es por f ilas, columnas o por
t ot ales. El pr ogr ama calcula, por defect o, los por cent aj es r efer idos al
t ot al de la t abla.
Manual G- St at 2. 0 57
Gr upos ( a| y)
Realiza una descript iva para una variable cuant it at iva, est rat ificada por ot ra
var iable cualit at iva o discr et a.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable r espuest a cuant it at iva y la Variable
explicat iva cualit at iva. Sólo se ut ilizan los r egist r os complet os par a
est as var iables.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Caj as: Gr áfico de Caj as de la var iable r espuest a par a los dist int os
valor es de la var iable explicat iva. Ver menú Gr áficos.
: Descr i pt i v a de l a v ar i abl e FC1 según el t i po de Fár maco que se ha
admi ni st r ado.
Est adíst icos de la variable FC1 por Farmaco mediant e la opción Grupos ( a| y) .
Estadísticos para la variable FC1 por FARMACO
======================================================================
-------------------------------------------------
Grupo 1 2
-------------------------------------------------
N 20.0 20.0
Media 75.8000 76.1000
Mediana 75.0000 73.0000
Varianza 90.0632 96.6211
Desviación Típica 9.4902 9.8296
Mínimo 62.0000 62.0000
Máximo 96.0000 96.0000
Cuartil Inferior 68.0000 68.0000
Cuartil Superior 80.0000 85.0000
Asimetría Estandarizada 1.3675 0.7484
Curtosis Estandarizada -0.2461 -0.8821
Coeficiente de Variación 12.5200 12.9167
-------------------------------------------------
58
Caj as de la variable FC1 est rat ificada por la
variable Farmaco mediant e la opción Grupos ( a| y) .
Gr upos ( a* b| y)
Descript iva para una variable cuant it at iva y est rat ificada por t odas las posibles
combinaciones de niveles de las var iables cualit at ivas a y b.
Manej o del programa
Var i abl es: Se ident ifica la var iable r espuest a cuant it at iva, y las
var iables explicat ivas cualit at ivas a y b for mador as de gr upos. Sólo se
ut ilizan los regist ros complet os para est as variables.
Est adíst i cos: Est adíst icos de la variable seleccionada para cada posible
cat egoría de las variables cualit at ivas combinadas. Se det allan en
Cuant it at iva ( y) .
Manual G- St at 2. 0 59
: Descr i pt i va de l a var i abl e Edad según l as var i abl es Sex o y
Fumador .
Result ados de la descr ipt iva de una var iable cuant it at iva por subgr upos
f or mados por dos var iables cualit at ivas.
Grupos (a*b|y) Estadísticos
===========================================================================
Variable Respuesta: EDAD
Variable(s) Explicativa(s): SEXO, FUMADOR
Número de Casos: 40
Desviación
SEXO N Media Típica Mínimo Máximo
------------------------------------------------------------
2 18 21.9333 1.1555 20.0000 24.5000
1 22 22.8091 1.5486 19.5000 25.6000
------------------------------------------------------------
Total 40 22.4150 1.4380 19.5000 25.6000
------------------------------------------------------------
Desviación
FUMADOR N Media Típica Mínimo Máximo
--------------------------------------------------------------
2 24 22.5833 1.3871 19.5000 25.6000
1 16 22.1625 1.5209 20.0000 25.4000
--------------------------------------------------------------
Total 40 22.4150 1.4380 19.5000 25.6000
--------------------------------------------------------------
SEXO Desviación
FUMADOR N Media Típica Mínimo Máximo
---------------------------------------------------------------
2,2 12 22.3583 1.0211 21.1000 24.5000
2,1 6 21.0833 0.9725 20.0000 22.5000
1,2 12 22.8083 1.6941 19.5000 25.6000
1,1 10 22.8100 1.4449 20.5000 25.4000
---------------------------------------------------------------
Total 40 22.4150 1.4380 19.5000 25.6000
---------------------------------------------------------------
60
Gr upos ( a* b* c| y)
Realiza una descript iva para una variable cuant it at iva ( y) est rat ificada por
t odas las posibles combinaciones de niveles de las variables cualit at ivas ( a) ,
( b) y ( c) .
Manej o del programa
Var i abl es: Se ident if ican la Variable respuest a cuant it at iva y las
Variables explicat ivas cualit at ivas que forman los grupos. Sólo se
ut ilizan los regist ros complet os para est as variables.
Est adíst i cos: Est adíst icos de la variable respuest a para cada posible
combinación de las cat egorías de las t res variables cualit at ivas. Se
det allan en Cuant it at iva ( y) .
Gr upos ( a| x yz)
Present a la descript iva de diferent es variables cuant it at ivas ( x) , ( y) , ( z)
est rat ificadas por una variable cualit at iva o discret a formadora de los grupos
( a) .
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable explicat iva cualit at iva y las
Variables respuest a cuant it at ivas.
Est adíst i cos: Est adíst icos de las var iables r espuest a según las
cat egorías de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
: Descr i pt i v a de Edad, FC1, FC2 par a l os di f er ent es gr upos de
Fár macos.
Result ados de la descr ipt iva de var ias var iables cuant it at ivas por subgr upos
f or mados por una var iable cualit at iva.
Manual G- St at 2. 0 61
Grupos (a|xyz). Estadísticos
======================================================================
Variable que forma los grupos : FARMACO
Variable(s) : EDAD, FC1, FC2
Número de Casos: 40
Nota: Sólo se consideran los registros (casos) con información
completa en todas las variables analizadas
Variable=EDAD
Desviación
FARMACO N Media Mediana Típica Mínimo Máximo
--------------------------------------------------------------------------
1 20 22.6000 22.8000 1.6588 19.5000 25.6000
2 20 22.2300 22.1500 1.1921 20.0000 24.9000
--------------------------------------------------------------------------
Total 40 22.4150 22.5500 1.4380 19.5000 25.6000
Variable=FC1
Desviación
FARMACO N Media Mediana Típica Mínimo Máximo
--------------------------------------------------------------------------
1 20 75.8000 75.0000 9.4902 62.0000 96.0000
2 20 76.1000 73.0000 9.8296 62.0000 96.0000
--------------------------------------------------------------------------
Total 40 75.9500 74.0000 9.5379 62.0000 96.0000
Variable=FC2
Desviación
FARMACO N Media Mediana Típica Mínimo Máximo
--------------------------------------------------------------------------
1 20 136.9500 137.0000 13.3435 116.0000 158.0000
2 20 138.4500 137.0000 13.5199 112.0000 165.0000
--------------------------------------------------------------------------
Total 40 137.7000 137.0000 13.2804 112.0000 165.0000
x | y
Realiza una descript iva bivariant e de dos variables cuant it at ivas. El modelo que
se asume es:
ε + β + β ·
1 0
x y
Los coeficient es β
0
y β
1
se est i man por b
0
( or denada en el or i gen) y por b
1
( pendient e) a t r avés del mét odo de mínimos cuadr ados:
62
2
x
2
xy
1
s
s
b · , x b y b
1 0
− ·
donde
∑ ·
·
n
1 i
i
x
n
1
x , ∑ ·
·
n
1 i
i
y
n
1
y
( ) ∑ −

·
·
n
1 i
2
i
2
x
x x
1 n
1
s , ( ) ∑ −

·
·
n
1 i
2
i
2
y
y y
1 n
1
s
( ) ( ) ∑ − −

·
·
n
1 i
i i
2
xy
y y x x
1 n
1
s
Por t ant o, la ecuación result ant e dada por el modelo de regresión lineal simple
es
x b b yˆ
1 0
+ ·
donde ^ y indica el valor que pr edice el modelo par a la var iable r espuest a a
par t ir de la infor mación de la var iable explicat iva.
Los residuos se calculan como la diferencia que hay ent re la variable respuest a
original y la que predice el modelo, es decir:
yˆ y e r esi duos − · ·
La desviación t ípica residual se calcula como
( ) ∑ −

·
2
e
e e
2 n
1
s
Se puede demost r ar que la media de los r esiduales es cer o, con lo que


·
2
e
e
2 n
1
s
Se divide por n - 2 en lugar de por n – 1 par a obt ener una est imación mej or de
la desviación t ípica residual poblacional.
Los er r or es est ándar ( EE) de los coeficient es del modelo se calculan a par t ir de
la desviación t ípica residual, de forma que
( )
( ) ∑ −
+ ·
·
n
1 i
2
i
2
e 0
x x
x
n
1
s b EE
Manual G- St at 2. 0 63
( )
( ) ∑ −
·
·
n
1 i
2
i
e 1
x x
1
s b EE
Una medida global de bondad del modelo es el coeficient e de det erminación R2
( “ R- Cuadrado” ) . El coeficient e de det erminación se calcula como
SCT
SCM
R
2
·
donde SCM es la suma de cuadr ados del modelo y SCT la suma de cuadr ados
t ot al ( ver expresiones en Análisis / x| y / Regresión Lineal Simple / Anova) . R2
en t ant o por cient o r epr esent a el por cent aj e de inf or mación que explica el
modelo. El coeficient e de det er minación t ambién se puede calcular como el
cuadr ado del coeficient e de cor r elación de Pear son.
El coeficient e de correlación de Pearson est á comprendido ent re –1 y + 1, es
adimensional y est á ínt imament e relacionado con la desviación t ípica residual.
Conviene señalar que correlación implica asociación lineal, no implica que no
haya ot r o t ipo de asociación no lineal ( como por ej emplo cur vilínea o senoidal) .
Por ot r a par t e cor r elación no implica causalidad.
El coef icient e de cor r elación r de Pear son est á dado por
y x
2
xy
s s
s
r ·
El coeficient e de cor r elación de Spear man es el análogo no par amét r ico al
coeficient e de correlación de Pearson, ya que ut iliza los rangos de las variables
y puede ser ut ilizado para variables ordinales o incluso dicot ómicas o para
variables cuant it at ivas con muest ras pequeñas. El coeficient e de correlación de
Pear son r equier e nor malidad en las var iables.
Para calcular el coeficient e de correlación de Spearman ent re dos variables
Var 1 y Var 2, se calculan los r angos de los valor es de ést as, a los que se denot a
por : R
i
( Var 1) y R
i
( Var 2) , si endo R
i
( Var 1) los r angos de Var 1 asociados al
individuo i y R
i
( Var 2) los r angos de Var 2 asociados al individuo i. A
cont inuación, se realizan los siguient es cálculos int ermedios:
( ) ( ) ( ) ∑ − ·
·
n
1 i
2
i i
2 Var R 1 Var R D
( ) ∑ − ·
Var1 en empates
empat es º n empat es º n T
3
x
( ) ∑ − ·
Var2 en empates
empat es º n empat es º n T
3
y
64
12
T n n
A
x
3
− −
· ,
12
T n n
B
y
3
− −
·
A part ir de los coeficient es calculados con ant erioridad, se calcula el coeficient e
de cor r elación r
s
de Spear man dado por
AB 2
D B A
r
S
− +
·
Se puede demost r ar que si se calcula el coef icient e de cor r elación de Pear son
sobr e las var iables R
i
( Var1) y R
i
( Var 2) se llega al mismo r esult ado.
Manej o del programa
Var i abl es: Se ident if ican las dos Variables cuant it at ivas X e Y.
Est adíst i cos: Est adíst icos de las variables seleccionadas. Se det allan
en Cuant it at iva ( y) .
Model o: Se present an los coeficient es de la rect a de regresión lineal de
mej or aj ust e por el mét odo de mínimos cuadr ados. También se
calculan los siguient es est adíst icos: r de Pear son, r cuadr ado,
Desviación Típica de Residuos y Rho de Spear man.
Rect a de Aj ust e : Pr esent a la r ect a de r egr esión est imada por mínimos
cuadr ados.
Opciones:
- La cabecera, t ít ulos, mínimo, máximo e increment o de los
ej es X e Y.
: Est udi ar l a r el aci ón l i neal de l as v ar i abl e FC2 y Edad.
Est adíst icos de la var iable FC2 y Edad.
Regresión Lineal Simple. Estadísticos
======================================================================
Variable Y: EDAD
Variable X: FC2
Número de Casos: 40
------------------------------------------
Manual G- St at 2. 0 65
Variable FC2 EDAD
------------------------------------------
N 40 40
Media 137.7000 22.4150
Mediana 137.0000 22.5500
Desviación Típica 13.2804 1.4380
Mínimo 112.0000 19.5000
Máximo 165.0000 25.6000
Rango 53.0000 6.1000
------------------------------------------
Modelo y Coeficient es de r egr esión y cor r elación de Edad por FC2.
Modelo de EDAD con FC2
====================================================================
Número de Casos: 40
Modelo: Lineal
--------------------------------
Ecuación: EDAD = 32.0126 - 0.0697 * FC2
--------------------------------
Coef. E.E.
--------------------------------
Ordenada 32.0126 1.8595
Pendiente -0.0697 0.0134
--------------------------------
r de Pearson (coeficiente de correlación): -0.6437
r cuadrado (coeficiente de determinación): 41.43%
Desviación Típica de los Residuos: 1.1149
Rho de Spearman: -0.6594
Gr áf ico de disper sión y r ect a de aj ust e de Edad f r ent e a FC2.
66
Manual G- St at 2. 0 67
Menú Anál i si s
Act ivar la opción Anál i si s del menú pr incipal o mediant e Alt + L. Est e menú
cont iene fundament alment e las pruebas est adíst icas univariant es y bivariant es,
t ant o para variables cualit at ivas como cuant it at ivas. Asimismo, se present a una
opción con los cálculos de las dist ribuciones t eóricas de probabilidad direct as e
inver sas. Los códigos ( a) o ( b) indican que el análisis ha sido diseñado par a
variables cualit at ivas y los códigos ( y) o ( x) para variables cuant it at ivas.
Di st r i buci ones
A par t ir del valor de los est adíst icos y de los gr ados de liber t ad, mediant e est a
opción, se pueden obt ener las pr obabilidades asociadas a las siguient es
dist ribuciones t eóricas: Normal, t - St udent , Chi- Cuadrado, F, Rango
Est udent izado y Shapiro- Wilk. I nversament e se pueden obt ener los valores de
los est adíst icos a par t ir de valor es de pr obabilidad. Donde es apr opiado se
consider an las funciones unilat er ales o bilat er ales.
Const a del siguient e submenú: Normal, Normal I nversa, t - St udent , t - St udent
I nversa, Chi- Cuadrado, Chi- Cuadrado I nversa, F, F I nversa, Rango
St udent izado I nversa y Shapiro- Wilk.
68
Di st r i buci ones à Nor mal
Par a un valor z de una dist r ibución nor mal se calcula el p- valor bilat er al, el p-
valor unilat eral izquierdo y el p- valor unilat eral derecho. Por ej emplo, para
z= 1. 96 se t iene que:
( ) 05 . 0 96 . 1 ) 1 , 0 ( N Pr ob 2 bi l at er al val or p · ≥ ⋅ · −
( ) 9750 . 0 96 . 1 ) 1 , 0 ( N Pr ob i zqui er da uni l at er al val or p · ≤ · −
( ) 0250 . 0 96 . 1 ) 1 , 0 ( N Pr ob der echa uni l at er al val or p · ≥ · −
Di st r i buci ones à Nor mal I nver sa
Par a un valor alfa se calcula el cor r espondient e valor z bilat er al y unilat er al
cor r espondient e a una dist r ibución nor mal. Por ej emplo, par a α= 0.05 se t iene
que:
96 . 1 bi l at er al val or z · − que ver ifica ( ) 05 . 0 96 . 1 ) 1 , 0 ( N Pr ob 2 · ≥ ⋅
6449 . 1 uni l at er al val or p · − que ver ifica ( ) 05 . 0 6449 . 1 ) 1 , 0 ( N Pr ob · ≥
Di st r i buci ones à t - St udent
Par a un valor t de una dist r ibución t - St udent con g gr ados de liber t ad se
calcula el p- valor bilat er al, el p- valor unilat er al izquier do y el p- valor unilat er al
derecho. Por ej emplo, para t = - 0. 0750 y g= 15 se t iene que:
( ) 9412 . 0 0750 . 0 t Pr ob 2 bi l at er al val or p
g
· − ≥ ⋅ · −
( ) 4706 . 0 0750 . 0 t Pr ob i zqui er da uni l at er al val or p
g
· − ≤ · −
( ) 5294 . 0 0750 . 0 t Pr ob der echa uni l at er al val or p
g
· − ≥ · −
: Cal cul ar l a pr obabi l i dad asoci ada al val or del est adíst i co t -
St udent = 2. 0421 par a 20 gr ados de l i ber t ad.
Result ados de la opción t - St udent .
Manual G- St at 2. 0 69
t-Student
======================================================================
Para t = 2.0421 y gl = 20
p-valor bilateral = 0.0546
p-valor unilateral izquierda = 0.9727
p-valor unilateral derecha = 0.0273
Di st r i buci ones à t - St udent I nver sa
Par a un valor alfa se calcula el cor r espondient e valor t bilat er al y unilat er al
cor r espondient e a una dist r ibución t - St udent con g gr ados de liber t ad. Por
ej emplo, par a α= 0. 05 y g= 15 se t iene que:
1314 . 2 bi l at er al val or t · − que ver ifica ( ) 05 . 0 1314 . 2 t Pr ob 2
g
· ≥ ⋅
7530 . 1 uni l at er al val or t · − que ver ifica ( ) 05 . 0 7530 . 1 t Pr ob
g
· ≥
Di st r i buci ones à Chi - Cuadr ado
Para un valor Chi- 2 de una dist ribución Chi- Cuadrado con g grados de libert ad
se calcula el p- valor unilat er al izquier do y el p- valor unilat er al der echo. Por
ej emplo, par a Chi- 2= 19. 0228 y g= 9 se t iene que:
( ) 9750 . 0 0228 . 19 Pr ob i zqui er da uni l at er al val or p
2
g
· ≤ χ · −
( ) 0250 . 0 0228 . 19 Pr ob der echa uni l at er al val or p
2
g
· ≥ χ · −
Di st r i buci ones à Chi - Cuadr ado I nver sa
Par a un valor alfa se calcula el cor r espondient e valor Chi- 2 unilat er al der echa
alfa/ 2 y unilat er al der echa alfa cor r espondient e a una dist r ibución Chi-
Cuadr ado con g gr ados de liber t ad. Por ej emplo, par a α= 0. 05 y g= 9 se t iene
que:
0228 . 19 2 / alf a der echa uni l at er al val or 2 Chi · − − que verifica
( ) 05 . 0 0228 . 19 Pr ob 2
2
g
· ≥ χ ⋅
9190 . 16 alf a der echa uni l at er al val or 2 Chi · − − que verifica
70
( ) 05 . 0 9190 . 16 Pr ob
2
g
· ≥ χ
: Cal cul ar el v al or del est adíst i co Chi - Cuadr ado par a una
pr obabi l i dad de 0. 05 y 17 gr ados de l i ber t ad.
Result ados de la opción Chi- Cuadr ado I nver sa.
Chi Cuadrado Inversa
===========================================================================
Para alfa = 0.0500 y gl = 17
Chi-2-valor unilateral derecha alfa/2 = 30.1910
Chi-2-valor unilateral derecha alfa = 27.5871
Di st r i buci ones à F
Par a un valor F de una dist r ibución F con gln gr ados de liber t ad del numer ador
y gld gr ados de liber t ad del denominador , se calcula el p- valor unilat er al
izquierdo y el p- valor unilat eral derecho. Por ej emplo, para F= 4. 3197, gln= 6 y
gld= 9 se t iene que:
( ) 9750 . 0 3197 . 4 F Pr ob i zqui er da uni l at er al val or p
gld ln, g
· ≤ · −
( ) 0250 . 0 3197 . 4 F Pr ob der echa uni l at er al val or p
gld ln, g
· ≥ · −
: Cal cul ar l a pr obabi l i dad de un v al or del est adíst i co F= 4. 5 par a 12
y 2 gr ados de l i ber t ad.
Result ados de la opción F.
F
======================================================================
Para F = 4.5000, gln = 12 y gld = 2
p-valor unilateral izquierda = 0.8040
p-valor unilateral derecha = 0.1960
Di st r i buci ones à F I nver sa
Par a un valor alfa se calcula el cor r espondient e valor F unilat er al der echa alfa/ 2
y unilat eral derecha alfa correspondient e a una dist ribución F con gln grados de
Manual G- St at 2. 0 71
liber t ad del numer ador y gld gr ados de liber t ad del denominador . Por ej emplo,
par a α= 0. 05, gln= 6 y gld= 9 se t iene que:
3197 . 4 2 / alf a der echa uni l at er al val or F · − que verifica
( ) 05 . 0 3197 . 4 F Pr ob 2
gld ln, g
· ≥ ⋅
3738 . 3 alf a der echa uni l at er al val or F · − que verifica
( ) 05 . 0 3738 . 3 F Pr ob
gld ln, g
· ≥
Di st r i buci ones à Rango Est udent i zado I nver sa
Par a un valor alf a se calcula el valor Rango Est udent izado unilat er al
correspondient e a una dist ribución Rango Est udent izado con gln los grados de
liber t ad del numer ador y gld los gr ados de liber t ad del denominador . El valor
de alf a debe ser par a est a opción super ior o igual a 0. 01 y menor o igual que
0. 1.
Por ej emplo par a α= 0. 05, gln= 10 y gld= 3 se t iene que:
8774 . 3 uni l at er al Est uden. Rango ·
Par a α= 0. 10, gln= 10 y gld= 3 se t iene que:
2704 . 3 l at er al uni Est uden. Rango ·
Di st r i buci ones à Shapi r o Wi l k
Par a un valor W del est adíst ico y un t amaño muest r al n se calcula el p- valor de
la dist ribución Shapiro- Wilk.
Por ej empl o par a W= 0. 9552 y n= 15 se t i ene que:
3272 . 0 val or p · −
72
Cual i t at i va ( a)
Abre un submenú con diferent es t écnicas est adíst icas para una variable
cualit at iva dicot ómica. Se incluyen las siguient es pr uebas: z- pr opor ción y z-
pr opor ción par a dat os agr upados.
Cual i t at i va ( a) à Una pr opor ci ón
Realiza el int er valo de confianza del par ámet r o poblacional pr opor ción y un
cont r ast e de hipót esis de una pr opor ción mediant e la pr ueba z- pr opor ción.
En el caso de que se est é est udiando una única var iable y que ést a sea
dicot ómica, es recomendable codificar dicha variable con unos y ceros. El valor
uno se suele r eser var par a el código con el que se quier e designar la ocur r encia
del suceso de int er és, por ej emplo Cur ación, mient r as que el valor de cer o se
r eser va par a el suceso complement ar io, por ej emplo No Cur ación. Ut ilizando
est a codificación, se expr esa una pr opor ción mediant e la fór mula:
n
x

n
1 i
i

·
·
El int er valo de confianza de una pr opor ción se calcula como
[ ] ) p
ˆ
( EE z p
ˆ
p
2 / 1 α −
t ∈
donde
( )
( )
n
pˆ 1 pˆ
pˆ EE

·
es el er r or est ándar de una pr opor ción y z
1- α/ 2
r epr esent a el valor de la abscisa
en una cur va de una dist r ibución nor mal que dej a a la izquier da de su valor un
ár ea de 1 - α/ 2 y a l a der echa un ár ea de α/ 2. Est e valor se encuent ra
t abulado, de f or ma que par a α = 0. 05 se t iene que z
1- α/ 2
= 1. 96.
Los int ervalos de confianza calculados del modo descrit o ant eriorment e
pueden dar lugar a límit es sin sent ido fuer a del int er valo [ 0 ; 1] en el caso de
que se est é t r abaj ando con pr opor ciones ext r emas cer canas a uno o a cer o. Por
est e mot ivo, exist en mét odos más precisos y al mismo t iempo más complej os
par a calcular los int er valos de confianza par a una pr opor ción, como por
ej emplo el mét odo exact o de Clopper - Pear son.
Manual G- St at 2. 0 73
En el caso de que se est é int er esado en dar af ir maciones acer ca de p en
t ér minos de, por ej emplo, que la pr opor ción en la población sea un
det er mi nado val or p
0
, se t iene que plant ear el pr oblema en t ér minos de
cont r ast e de hipót esis, donde:
H
0
: p = p
0
H
1
: p ≠ p
0
siendo H
0
la hipót esis nula y H
1
la hipót esis alt er nat iva.
Para llevar a cabo est e cont rast e se const ruye el est adíst ico de cont rast e
exper iment al z dado por
( )
n
p 1 p
p pˆ
z
0 0
0


·
que baj o la hipót esis nula sigue una dist ribución normal.
Par a cont r ast es unilat er ales del t ipo:
H
0
: p = p
0
H
1
: p > p
0
se calcula z como ant es, per o a la hor a de calcular el p- valor , sólo se consider a
el p- valor como el ár ea baj o la cur va nor mal a la der echa de z

( sin consider ar
el valor absolut o) .
En el caso de pr opor ciones ext r emas conviene usar el mét odo exact o basado
en la dist r ibución binomial. En cualquier caso si n< = 50 se ut iliza el mét odo
exact o y en caso cont r ar io el asint ót ico.
Manej o del programa
Var i abl es: I dent ificar la var iable dicot ómica a analizar .
Fr ecuenci as: Los principales est adíst icos descript ivos para variables
cualit at ivas son: las frecuencias absolut as y las frecuencias relat ivas.
Par a cada cat egor ía de la var iable cualit at iva se muest r a el númer o de
individuos que per t enecen a ella ( fr ecuencias absolut as) , así como el
porcent aj e respect o al t ot al de individuos ( frecuencias relat ivas) .
74
Bar r as: Gr áfico de bar r as par a una var iable cualit at iva. Ver menú
Gr áf i cos.
z- Pr opor ci ón: Se pr esent a el int er valo de confianza del par ámet r o
proporción poblacional y los result ados del cont rast e de hipót esis de
una pr opor ción mediant e la pr ueba z- pr opor ción.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0. 5, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
Cual i t at i va ( a) à Una pr opor ci ón. Dat os Agr upados
A part ir de los dat os resumidos de t amaño muest ral y propoción muest ral, se
puede r ealizar , sin el ficher o de dat os, la opción Análisis / Cualit at iva ( a) / Una
proporción. Los fundament os t eóricos y la formulación son idént icos a los
pr esent ados en las opciones ant er ior es r espect ivas con dat os a par t ir de
f i cher o.
Manej o del programa
Los dat os necesar ios en el pr ogr ama son:
- Et iquet a: Nombr e de la var iable.
- Tamaño Muest r al: Valor de n.
- Pr opor ción Muest r al: Pr opor ción de la var iable en la muest r a p.
Una vez int r oducidos t odos los dat os, se accede a la pest aña z- Pr opor ción.
Manual G- St at 2. 0 75
z- Pr opor ci ón: Se pr esent a el int er valo de confianza del par ámet r o
proporción poblacional y los result ados del cont rast e de hipót esis de
una proporción mediant e la prueba z- propoción.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0. 5, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
: Se r eal i za un cont r ast e de hi pót esi s sobr e l a var i abl e Fumador .
Los dat os necesar i os son: Et i quet a= Fumador ; Tamaño Muest r al = 40;
Pr opor ci ón Muest r al = 0. 6.
Result ados de la pest aña z- Pr opor ción de la opción Una Pr opor ción.
Estimación y Contraste de Una Proporción Poblacional para Fumador
======================================================================
Tamaño Muestral : 40
Proporción: 0.6000
Estimación
----------
I.C. al 95.00% para la proporción: [0.4333, 0.7514]
Contraste z-Proporción
----------------------
Hipótesis Nula : proporción = 0.5000
Hipótesis Alternativa : no igual
p-valor (exacto): 0.2682
76
Cuant i t at i va ( y)
Abre un submenú con diferent es t écnicas est adíst icas para una variable
cuant it at iva. Se incluyen las siguient es pr uebas: bondad de aj ust e, t - St udent ,
Chi- Cuadrado para una desviación t ípica, t - St udent y Chi- Cuadrado para una
desviación t ípica par a dat os agr upados, r angos signados y signos.
Cuant i t at i va ( y) à Aj ust e
Est a opción r ealiza una pr ueba de aj ust e a una dist r ibución t eór ica. Se analiza
mediant e pr uebas de bondad de aj ust e si se puede asumir que una var iable
sigue o no la dist r ibución Nor mal o Unifor me. Las pr uebas que se cont emplan
par a el aj ust e a una Nor mal son la pr ueba de bondad de aj ust e Chi- Cuadr ado,
la pr ueba de bondad de aj ust e de Kolmogor ov con cor r ección de Lilliefor s y la
pr ueba de bondad de aj ust e de Shapir o- Wilk. Las pr uebas que se cont emplan
par a el aj ust e a una Unif or me son la pr ueba de bondad de aj ust e Chi- Cuadr ado
y la pr ueba de bondad de aj ust e de Kolmogor ov.
Pr ueba de bondad de aj ust e Chi - Cuadr ado
Se divide en t r amos el r ango de la var iable y se analiza el númer o de valor es
obser vados en los dist int os t r amos y los valor es esper ados según la
dist ribución t eórica correspondient e. El est adíst ico de cont rast e se evalúa como
la suma en los dist int os t ramos considerados del cocient e ent re las diferencias
al cuadrado de las frecuencias observadas y esperadas ent re las frecuencias
esperadas. Est e est adíst ico de cont rast e sigue una dist ribución Chi- Cuadrado
con gr ados de liber t ad igual al númer o de t r amos consider ados menos uno y
menos el númer o de par ámet r os est imados. Est e cont r ast e sólo se r ealiza si n
mayor o igual que 20.
Pr ueba de bondad de aj ust e Kol mogor ov
Se calcula el est adíst ico D como la máxima dist ancia obser vada ent r e la función
de dist r ibución t eór ica y la empír ica. Par a calcular el p- valor , asociado a est e
est adíst ico D, es necesar io r ealizar los siguient es cálculos adicionales:
D n Z ·
) Z / ( - 1. 233701 Exp Q
2
·
Manual G- St at 2. 0 77
) Z * (-2 Exp Q2
2
·
1 val or - p 0. 27 Z 0 si · ⇒ < <·
) Q Q (Q * Z) ( 2. 506628/ - 1 val or - p 1 Z 0. 27 si
25 9
+ + · ⇒ < <·
) Q2 - Q2 Q2 - ( Q2 * 2 val or - p 3.1 Z 1 si
16 9 4
+ · ⇒ < <·
0 val or - p 3.1 Z si · ⇒ >·
Pr ueba de bondad de aj ust e de Kol mogor ov con cor r ecci ón de Li l l i ef or s
En el caso de r ealizar la pr ueba de Kolmogor ov de aj ust e a la nor mal, es
recomendable ut ilizar la corrección de Lilliefors, con lo que el p- valor de
Lilliefors p
L
se calcula de la forma siguient e:
Si n < = 100 ⇒
) 2. 78019 (n * 7. 01256 - A + ·
2. 78019 n * 2. 99587 B + ·
n / 1. 67997 n / 0. 974598 2. 1804661 C + + ·
Si n > 100 ⇒
0.98
n * 054 7. 90289126 - A ·
n * 5721 3. 18037017 B
0.49
·
2. 2947256 C ·
Y se calcula DC de forma que

A * 2
C * A * 4 - B * B B
DC
− −
·
0.1 p DC D si
L
· ⇒ ·
) 2. 3025851 - C D * B D * A ( Exp p DC D si
2
L
+ + · ⇒ >
0. 1" " p DC D si
L
> · ⇒ <
78
Pr ueba de bondad de aj ust e de Shapi r o- Wi l k
Shapir o y Wilk ( 1965) int r oducen la pr ueba W de nor malidad. Post er ior ment e,
en 1982, Royst on implement a un algor it mo con el nombr e de AS 181 par a
7≤n≤2000 par a llevar a cabo dicha pr ueba. En 1992 el pr opio Royst on descubr e
que el algorit mo AS 181 es incorrect o para n> 50 y en 1995 propone un nuevo
algor it mo con el nombr e de AS R94 válido par a 3≤n≤5000. Hast a el año 2000
los pr incipales pr ogr amas est adíst icos comer ciales no cor r igier on el er r or y
siguier on usando el algor it mo AS 181. En G- St at est á implement ada la ver sión
corregida AS R94. Se puede decir, por t ant o, que la t écnica más moderna de
G- St at es el algor it mo AS R94 par a el cálculo de la pr ueba W de Shapir o- Wilk.
Manej o del programa
Var i abl es: Se ident ifica la variable cuant it at iva para ver su posible
dist r ibución.
Est adíst i cos: Est adíst icos de la var iable seleccionada. Se det allan en
Cuant it at iva ( y) .
Hi st ogr ama : Genera un hist ograma. Más información en el apart ado
Menú Gr áf icos.
Cont r ast e : Resul t ados de l a pr ueba de bondad de aj ust e de una
var iable a una dist r ibución t eór ica.
Opciones:
- Dist r ibución: Nor mal o unifor me.
: Se desea compr obar si l a var i abl e FC2FC1 si gue una di st r i buci ón
Nor mal .
Result ados del cont r ast e de nor malidad de la var iable FC2FC1.
Contrastes de Hipótesis de Bondad de Ajuste para FC2FC1
==========================================================================
Número de Casos: 40
Distribución Teórica: Normal
Media: 61.7500
Desviación Típica: 10.9772
Manual G- St at 2. 0 79
--------------------------------------------------------------------------
Límite Límite
Inferior Superior Frec. Observadas Frec. Esperadas Chi-Cuadrado
--------------------------------------------------------------------------
inferior 51.1304 7 6.6667 0.0167
51.1304 57.0218 6 6.6667 0.0667
57.0218 61.7500 7 6.6667 0.0167
61.7500 66.4782 6 6.6667 0.0667
66.4782 72.3696 7 6.6667 0.0167
72.3696 superior 7 6.6667 0.0167
--------------------------------------------------------------------------
Chi Cuadrado = 0.2000 con 3.0 G.L. p-valor = 0.9776
D+ de Kolmogorov: 0.0633
D- de Kolmogorov: -0.0738
DN: 0.0738
p-valor: 0.9812
p-valor Lilliefors corregido: >0.1
W Shapiro-Wilk: 0.9753
p-valor Shapiro-Wilk: 0.5212
La prueba recomendada es la de Shapiro- Wilk.
Cuant i t at i va ( y) à t - St udent
Realiza el int er valo de confianza del par ámet r o poblacional media y un
cont rast e de hipót esis mediant e la prueba t - St udent para una muest ra.
El int er valo de confianza par a una media se calcula como
[ ] ) x ( EE t x
gl ; 2 / 1 α −
t ∈ µ
donde
n
x
x
n
1 i
i

·
·
( )
,
`

.
|
∑ −

·
·
n
1 i
2
i
x x
1 n
1
s
80
( )
n
s
x EE ·
siendo ( ) x EE el er r or est ándar de l a medi a y t
1- α/ 2; gl
represent a el valor de la
abscisa en una cur va de una dist r ibución t - St udent con gl gr ados de liber t ad
dados por ( n - 1) , que dej a a la izquier da de su valor un ár ea de 1 - α/ 2 y a la
der echa un ár ea de α/ 2. Est e valor se encuent ra t abulado, de forma que para α
= 0. 05 y gl = 9 se t iene que t
1- α/ 2; gl
= 2. 26.
En el caso de que se est é int er esado en dar af ir maciones acer ca de µ en
t ér minos de, por ej emplo, que la media en la población sea un det er minado
val or µ
0
, se t iene que plant ear el pr oblema en t ér minos de cont r ast e de
hipót esis, donde:
H
0
: µ = µ
0
H
1
: µ ≠ µ
0
siendo H
0
la hipót esis nula y H
1
la hipót esis alt er nat iva.
Para llevar a cabo est e cont rast e, se const ruye el est adíst ico de cont rast e
exper i ment al t dado por
n
s
x
t
0
µ −
·
que r ecibe el nombr e de pr ueba t - St udent par a una media y que baj o la
hipót esis nula sigue una dist ribución t - St udent con ( n - 1) grados de libert ad.
Par a cont r ast es bilat er ales se calcula el p- valor como el ár ea baj o la cur va t -
St udent con ( n - 1) gr ados de liber t ad a la der echa del valor absolut o de t más
el ár ea a la izquier da de menos el valor absolut o de t .
Par a cont r ast es unilat er ales del t ipo:
H
0
: µ = µ
0
H
1
: µ > µ
0
se calcula t como ant es, per o a la hor a de calcular el p- valor sólo se consider a
el ár ea baj o la cur va de la dist r ibución nor mal a la der echa de t

( sin considerar
el valor absolut o) .
Manej o del programa
Var i abl es: Se ident ifica la var iable cuant it at iva a analizar .
Manual G- St at 2. 0 81
Est adíst i cos: Est adíst icos de la var iable seleccionada. Se det allan en
Cuant it at iva ( y) .
Caj as: Gráfico de Caj as para una variable cuant it at iva. Ver menú
Gr áf icos
t - St udent : Se present a el int ervalo de confianza del parámet ro
poblacional media y los result ados del cont rast e de hipót esis de una
media mediant e la pr ueba t - St udent par a una muest r a.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0. 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
: Cont r ast ar si l a medi a de l a v ar i abl e FC1FC2 es super i or a 60.
Result ados de la pr ueba t - St udent par a una var iable.
Estimación y Contraste de Una Media Poblacional para FC2FC1
======================================================================
Tamaño Muestral: 40
Media: 61.7500
Estimación
----------
I.C. inferior al 95.0000% para la media: 61.7500 - 2.9244 [58.8256]
t-Student
---------
Hipótesis Nula: media = 60.0000
Hipótesis Alternativa: mayor que
Estadístico de contraste t: 1.0083
p-valor: 0.1598
82
Cuant i t at i va ( y) à Chi - 2 par a una Desvi aci ón Típi ca
Realiza el int er valo de confianza del par ámet r o poblacional desviación t ípica y
un cont r ast e de hipót esis de una desviación t ípica mediant e el est adíst ico de
Chi- Cuadr ado.
El int ervalo de confianza de una desviación t ípica se calcula como
( ) ( )

,
`

.
|
χ
∑ −
χ
∑ −
∈ σ
α α −
2
2 / , gl
2
i
2
2 / 1 , gl
2
i
x x
,
x x
donde
2
2 / 1 , gl α −
χ r epr esent a el valor de la abscisa en una cur va de una
dist r ibución Chi- Cuadr ado con gr ados de liber t ad gl= n- 1 que dej a a la izquier da
de su valor un ár ea de 1 - α/ 2 y
2
2 / , gl α
χ r epr esent a el valor de la abscisa en
una curva de una dist ribución Chi- Cuadrado con grados de libert ad gl que dej a
a l a i zqui er da de su val or un ár ea de α/ 2, de f or ma que par a α = 0. 05 y n= 10,
se t i ene que 0228 . 19
2
2 / 1 , gl
· χ
α −
y 7004 . 2
2
2 / , gl
· χ
α
.
En el caso de que se est é int er esado en dar af ir maciones acer ca de σ en
t ér minos de, por ej emplo, que la desviación t ípica en la población sea un
det erminado valor σ
0
, se t iene que plant ear el pr oblema en t ér minos de
cont r ast e de hipót esis, donde:
H
0
: σ = σ
0
H
1
: σ ≠ σ
0
siendo H
0
la hipót esis nula y H
1
la hipót esis alt er nat iva.
Para llevar a cabo est e cont rast e se const ruye el est adíst ico de cont rast e
exper iment al χ
2
dado por
( ) ( )
2
0
2
i
2
0
2
2
x x s 1 n
σ
∑ −
·
σ

· χ
que baj o la hipót esis nula sigue una dist ribución Chi- Cuadrado con grados de
l i ber t ad gl = n - 1.
Manej o del programa
Var i abl es: Se ident ifica la var iable cuant it at iva a analizar .
Manual G- St at 2. 0 83
Est adíst i cos: Est adíst icos de la var iable seleccionada. Se det allan en
Cuant it at iva ( y) .
Caj as: Gráfico de Caj as para una variable cuant it at iva. Ver menú
Gr áf icos
Chi - Cuadr ado: Se pr esent a el int er valo de confianza del par ámet r o
poblacional desviación t ípica y los result ados del cont rast e de hipót esis
de una desviación t ípica mediant e el est adíst ico de Chi- Cuadr ado.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 1. 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
: Se qui er e cont r ast ar si l a desvi aci ón t ípi ca de l a var i abl e FC2FC1
es super i or a un v al or t eór i co de 8.
Result ados de la pr ueba Chi- 2 par a una desviación t ípica.
Estimación y Contraste de Una Desviación Típica Poblacional para FC2FC1
======================================================================
Tamaño Muestral: 40
Media: 61.7500
Desviación Típica: 10.9772
Grados de Libertad: 39
Estimación
----------
I.C. inferior al 95.00% para la desviación típica: [9.2798]
Contraste Chi-Cuadrado
----------------------
84
Hipótesis Nula: sigma = 8.0000
Hipótesis Alternativa: mayor que
Estadístico de contraste chi-cuadrado: 73.4297
p-valor: 0.0007
Cuant i t at i va ( y) à t - St udent y Chi - 2 par a dt . Dat os
Agr upados
A part ir de los dat os resumidos de t amaño muest ral, media y desviación t ípica
muest r al, se puede r ealizar , sin el f icher o de dat os, las opciones Análisis /
Cuant it at iva ( y) / t - St udent y Análisis/ Cuant it at iva ( y) / Chi- 2 para una
Desviación Típica. Los fundament os t eóricos y la formulación son idént icos a los
pr esent ados en las opciones ant er ior es r espect ivas con dat os a par t ir de
f i cher o.
Se t i ene en cuent a que aunque no se t engan l os val or es i ndi vi dual es x
i
, se
verifica que
( ) ( )
2
2
i
s 1 n x x − · ∑ −
Manej o del programa
Los dat os necesar ios son:
- Et iquet a: Nombr e var iable.
- Tamaño muest r al: el valor de n.
- Media muest r al
- Desviación t ípica muest ral.
Se accede a las pest añas t - St udent y Chi- Cuadr ado. Es necesar io haber
cumpliment ado t odos los dat os.
t - St udent : Se present a el int ervalo de confianza del parámet ro
poblacional media y los result ados del cont rast e de hipót esis de una
media mediant e la pr ueba t - St udent par a una muest r a.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0. 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
Manual G- St at 2. 0 85
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
Chi - Cuadr ado: Se pr esent a el int er valo de confianza del par ámet r o
poblacional desviación t ípica y los result ados del cont rast e de hipót esis
de una desviación t ípica mediant e el est adíst ico de Chi- Cuadr ado.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 1. 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
Cuant i t at i va ( y) à Rangos Si gnados
Realiza un cont rast e de hipót esis de la mediana de una dist ribución mediant e la
pr ueba de los Rangos signados. Es una pr ueba no par amét r ica.
La pr ueba de los Rangos signados par a una muest r a calcula la var iable Rt a2
como en el caso de la prueba de Signos, a cont inuación se crea la variable
Or den del valor absolut o de Rt a2, que es el or den que ocupa la var iable Valor
absolut o de Rt a2, después se calcula los rangos de Orden del valor absolut o de
Rt a2, asignando el r ango medio en caso de empat es poniendo el signo que
t uvier a la var iable Rt a2 ( de ahí el nombr e de Rangos signados) . Como ant es:
n
+
= númer o de signos ( + ) de Rt a2
n
-
= númer o de signos ( - ) de Rt a2
n
*
= n
+
+ n
-
86
A part ir de est os rangos se consideran
∑ ·
+
+
grupo
r angos T ,
∑ ·


grupo
r angos T ,
que ver if ican
[ ] [ ] ( ) 1 n n
4
1
T E T E
* *
+ · ·
− +
,
[ ] [ ] ( )( ) ( ) ∑ − − + + · ·
− +
empat es
3 * * *
empat es º n empat es º n
48
1
1 n 2 1 n n
24
1
T V T V
La forma de realizar los cont rast es bilat erales y unilat erales se recoge en la
siguient e t abla:
Hipót esis nula Hipót esis alt er nat iva T
med = med
0
med ≠ med
0 mín { T+ T- }
med = med
0
med < med
0
T+
med = med
0
med > med
0
T-
En t odas las sit uaciones el est adíst ico de cont r ast e es
[ ]
[ ] T V
T E T
z

·
que sigue una dist ribución normal N( 0, 1) .
Manej o del programa
Var i abl es: Se ident ifica la var iable cuant it at iva a analizar .
Est adíst i cos: Est adíst icos de la var iable seleccionada. Se det allan en
Cuant it at iva ( y) .
Caj as: Gráfico de Caj as para una variable cuant it at iva. Ver menú
Gr áf icos
Manual G- St at 2. 0 87
Rangos Si gnados: Se pr esent an los r esult ados del cont r ast e de
hipót esis de la mediana de una dist r ibución mediant e la pr ueba de
Rangos signados.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0. 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
: Cont r ast ar , medi ant e l a pr ueba de Rangos si gnados, si l a medi ana
de l a v ar i abl e FC2 es super i or a 130.
Result ado de la pr ueba de los r angos signados par a una var iable.
Prueba de Rangos Signados de la mediana para FC2
======================================================================
Tamaño Muestral: 40
Mediana: 137.0000
Rangos Signados
---------------
Hipótesis Nula: mediana = 130.0000
Hipótesis Alternativa: no igual
Rango medio de valores por debajo del valor a contrastar de la mediana:
22.9464
Rango medio de valores por encima del valor a contrastar de la mediana:
14.7917
Estadístico de contraste: -3.1287 (con corrección por empates)
p-valor: 0.0018
Cuant i t at i va ( y) à Si gnos
Realiza un cont rast e de hipót esis de la mediana de una dist ribución mediant e la
pr ueba de los signos. Es una pr ueba no par amét r ica.
88
La pr ueba de los Signos par a una muest r a calcula, en pr imer lugar , una nueva
var iable, a la que se denot a por Rt a2, que es igual a la var iable or iginal, que se
denot a por Rt a, menos el valor que se est á cont r ast ando med
0
. Para est a
nueva var iable se calculan:
n
+
= númer o de signos ( + ) de Rt a2
n
-
= númer o de signos ( - ) de Rt a2
n
*
= n
+
+ n
-
con l o que n
+
ser ía el númer o de valor es de Rt a por encima del valor de la
mediana que se est é cont r ast ando y n
-
ser ía el númer o de valor es de Rt a por
debaj o. Obser var que n
*
es menor que el t amaño or iginal, ya que no se
cuent an los empat es pr oducidos por aquellos valor es de individuos con valor en
la variable original igual a med
0
.
La forma de realizar los cont rast es bilat erales y unilat erales se recoge en la
siguient e t abla:
Hipót esis nula Hipót esis alt er nat iva k
med = med
0
med ≠ med
0 mín { n
+
, n
-
}
med = med
0
med < med
0
n
+
med = med
0
med > med
0
n
-
En t odas las sit uaciones se considera
[ ]
*
n
2
1
k E ·
[ ]
*
n
2
1
2
1
k V ·
y el est adíst ico de cont rast e es
[ ]
[ ] k V
k E k
z

·
que sigue una dist ribución normal N( 0, 1) .
Manej o del programa
Var i abl es: Se ident ifica la var iable cuant it at iva a analizar .
Manual G- St at 2. 0 89
Est adíst i cos: Est adíst icos de la var iable seleccionada. Se det allan en
Cuant it at iva ( y) .
Caj as: Gráfico de Caj as para una variable cuant it at iva. Ver menú
Gr áf icos
Si gnos: Se pr esent an los r esult ados del cont r ast e de hipót esis de la
mediana de una dist r ibución mediant e la pr ueba de signos.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0. 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
: Cont r ast ar , medi ant e l a pr ueba de l os si gnos, si l a medi ana de l a
v ar i abl e FC2 es super i or a 130.
Result ados de la pr ueba de los signos par a una var iable.
Prueba de Signos de la mediana para FC2
========================================================================
Tamaño Muestral: 40
Mediana: 137.0000
Signos
------
Hipótesis Nula: mediana = 130.0000
Hipótesis Alternativa: mayor que
Número de valores por debajo del valor a contrastar de la mediana: 12
Número de valores por encima del valor a contrastar de la mediana: 28
Estadístico de contraste: -2.5298
p-valor: 0.0057
90
Tabl as ( a| b)
Cont iene un submenú con difer ent es t écnicas est adíst icas par a dos var iables
cualit at ivas. En algunos casos se supone que exist e un modelo donde una
variable explicat iva cualit at iva ( a) explica una variable respuest a cualit at iva
( b) ; en ot r os casos no se supone ningún modelo y est amos ant e t écnicas de
asociación. Se incluyen las siguient es pruebas: Chi- Cuadrado, Chi- Cuadrado
par a dat os agr upados, z- pr opor ciones par a dat os agr upados, Chi- Cuadr ado de
t endencia lineal, Chi- Cuadr ado de t endencia lineal par a dat os agr upados,
Fisher , Fisher par a dat os agr upados, McNemar y McNemar par a dat os
agr upados.
Tabl as ( a| b) à Chi - Cuadr ado
Realiza la pr ueba Chi- Cuadr ado que cont r ast a la asociación ent r e dos var iables
cualit at ivas que pueden ser dicot ómicas o nominales. En el caso de que una de
las var iables haga el papel de var iable r espuest a y sea dicot ómica, est amos
hablando de la comparación de varias proporciones. Se necesit a que no más
del 20% de las celdas t engan valor es esper ados menor es de cinco.
Par a calcular el est adíst ico de cont r ast e Chi- Cuadr ado, se const r uye en pr imer
lugar la t abla de cont ingencia de dimensiones r ( númer o de filas) por c
( número de columnas) con las frecuencias absolut as observadas n
ij
, que son el
result ado de cont ar el número de individuos para cada par de posibilidades de
los dist int os niveles i de la var iable en filas y j de la var iable en columnas.
A cont inuación se calcula la t abla de cont ingencia de frecuencias absolut as
esper adas mediant e la expr esión:
n
c r
e
j i
ij
·
donde r
i
indica el t ot al de individuos de la fila i , c
j
el t ot al de individuos de la
columna j y n el t ot al de individuos.
El est adíst ico de cont rast e es
( )
∑ ∑

· χ
· ·
r
1 i
c
1 j
ij
2
ij ij 2
e
e n
que sigue baj o la hipót esis nula una dist ribución χ
2
, con ( r - 1) x( c- 1) gr ados de
l i ber t ad.
Manual G- St at 2. 0 91
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable Fila y la Variable Columna.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas. En cada celda apar ece en t ér minos absolut os el númer o de
individuos dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Chi - Cuadr ado: Se pr esent an los r esult ados de la pr ueba Chi- Cuadr ado
que cont r ast a la asociación ent r e dos var iables cualit at ivas. Asimismo,
se muest r a, par a ver la validez de los r esult ados, el númer o y
pr opor ción de celdas con fr ecuencias absolut as esper adas menor de 5 y
menor de 1.
: Real i zar l a pr ueba Chi - Cuadr ado par a est abl ecer si l a v ar i abl e
Sex o est á r el aci onada con l a v ar i abl e Fumador .
Tabla de f r ecuencias de la opción Chi- Cuadr ado.
Tabla de Frecuencias de FUMADOR (filas) por SEXO (columnas)
======================================================================
Número de Casos: 40
SEXO | 1 | 2 | Total
FUMADOR | | | Fila
------------------------------------------------------
| 10 | 6 | 16
1 | 62.50 | 37.50 | 40.00
------------------------------------------------------
| 12 | 12 | 24
2 | 50.00 | 50.00 | 60.00
------------------------------------------------------
Total | 22 | 18 | 40
Columna | 55.00 | 45.00 | 100.00
Los porcentajes de cada celda se refieren al total de cada fila
92
Result ados de la pr ueba Chi- Cuadr ado.
Chi-Cuadrado de FUMADOR (filas) por SEXO (columnas)
======================================================================
Tamaño Muestral: 40
Estadístico de contraste Chi-Cuadrado: 0.6061
G.L.: 1
p-valor: 0.4363
Nº de celdas con frecuencias absolutas esperadas < 5: 0 de 4, un 0.0000%
Nº de celdas con frecuencias absolutas esperadas < 1: 0 de 4, un 0.0000%
Tabl as ( a| b) à Chi - Cuadr ado. Dat os Agr upados
A par t ir de dat os agr upados se r ealiza la pr ueba de Chi- Cuadr ado par a dos
var iables cualit at ivas. Los dat os agr upados se int r oducen dir ect ament e en una
cuadrícula en forma de t abla de r filas y c columnas. Los fundament os t eóricos
y la for mulación son idént icos a los pr esent ados en la opción de análisis
ant er ior con dat os a par t ir de un f icher o.
Manej o del programa
Dat os Agr upados: En la pest aña de dat os agr upados hay una
cuadrícula que permit e la ent rada direct a del número de casos dent ro
de cada posible combinación de cat egor ías o niveles. Se puede definir
el númer o de niveles de las dos var iables mediant e el númer o de filas y
columnas. El bot ón " Crear Tabla" prepara la est ruct ura de la t abla
aj ust ada al númer o de f ilas y columnas def inido. Por def ect o apar ecen
en la t abla unos valor es que deben ser sust it uidos por los dat os del
usuar io.
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valores falt ant es, negat ivos, decimales o alfanuméricos. Est e programa
no per mit e t ablas menor es de 2x2.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas. En cada celda apar ece en t ér minos absolut os el númer o de
individuos dent ro de cada posible combinación de cat egorías. Est os
valores son los que se han int roducido en la cuadrícula de ent rada de
dat os. Adicionalment e, se pueden obt ener los porcent aj es de dichos
valores con relación al número t ot al de individuos en una cat egoría en
fila ( porcent aj es fila) , en una cat egoría en columna ( porcent aj es
Manual G- St at 2. 0 93
columna) y del t ot al de individuos ( porcent aj e t ot al) . El programa
calcula, por defect o, los por cent aj es r efer idos al t ot al de la t abla.
Chi - Cuadr ado: Se present an los result ados de la prueba Chi- Cuadrado
que cont r ast a la asociación ent r e dos var iables cualit at ivas. Asimismo,
se muest r a, par a ver la validez de los r esult ados, el númer o y
pr opor ción de celdas con fr ecuencias absolut as esper adas menor de 5 y
menor de 1.
: Se desea r eal i zar l a pr ueba Chi - Cuadr ado sobr e l a si gui ent e t abl a
de cont i ngenci a:
Var a_1 Var a_2 Var a_3
Var b_1 23 45 12
Var b_2 34 66 26
En la pest aña Dat os Agr upados cr ear una t abla de 2 filas y 3 columnas,
int roducir los dat os, hacer clic en cualquier ot ra celda de la t abla agregada para
confir mar t odos los dat os e ir a la pest aña Chi- Cuadr ado.
Result ados de la pr ueba Chi- Cuadr ado.
Chi-Cuadrado de Filas por Columnas
========================================================================
Tamaño Muestral: 206
Estadístico de contraste Chi-Cuadrado: 1.0334
G.L.: 2
p-valor: 0.5965
Nº de celdas con frecuencias absolutas esperadas < 5: 0 de 6, un 0.0000%
Nº de celdas con frecuencias absolutas esperadas < 1: 0 de 6, un 0.0000%
Tabl as ( a| b) à Dos Pr opor ci ones. Dat os Agr upados
A part ir de dat os agrupados se realiza el int ervalo de confianza del parámet ro
dif er encia poblacional de dos pr opor ciones y el cont r ast e de hipót esis de dos
proporciones mediant e la prueba z- Proporciones.
Si se est á en el caso de que se t engan dos var iables dicot ómicas donde se
pueda considerar una variable explicat iva, por ej emplo, Trat amient o con dos
niveles dados por Tr at amient o A y Tr at amient o B y ot r a var iable r espuest a, por
94
ej emplo, Est ado de salud con dos niveles dados por Enfer mo y Sano, se podr ía
ver si hay influencia de la variable explicat iva Trat amient o en la variable
r espuest a Est ado de salud. Par a ello se est udiar ía la dif er encia ent r e la
pr opor ción de enf er mos par a el Tr at amient o A y la pr opor ción de enf er mos
par a el Tr at amient o B.
La for ma de r ealizar un int er valo de confianza par a el ver dader o valor del
parámet ro diferencia de dos proporciones p
1
– p
2
es
( ) [ ] ) p
ˆ
p
ˆ
( EE z p
ˆ
p
ˆ
p
2 1 2 / 1 2 1
− t − ∈
α −
donde ^ p
1
represent a la proporción muest ral est imada para p
1
y ^ p
2
r epr esent a la pr opor ción muest r al est imada par a p
2
y EE( ^ p
1
- ^ p
2
) el er r or
est ándar est imado de la dif er encia de dos pr opor ciones ( la r aíz cuadr ada de la
varianza de la dist ribución muest ral de la diferencia de dos proporciones) dado
por
( ) ( )
( ) ( )
2
2 2
1
1 1
2
2
2
1 2 1
n
pˆ 1 pˆ
n
pˆ 1 pˆ
pˆ EE pˆ EE ) pˆ pˆ ( EE

+

· + · −
que recoge la variabilidad muest ral.
En el caso de que se quier a r ealizar cont r ast e de hipót esis par a dos
pr opor ciones del t ipo:
H
0
: p
1
- p
2
= p
0
H
1
: p
1
- p
2
≠ p
0
si endo H
0
la hipót esis nula y H
1
la hipót esis alt ernat iva, es necesario const ruir
el est adíst ico de cont r ast e exper iment al z dado por
( ) ( )
( )
2 1
2 1 2 1
pˆ pˆ EE
p p pˆ pˆ
z

− − −
·
Baj o la hipót esis nula p
0
= 0, las dos proporciones son iguales y se t iene que
( ) ( ) ( ) ( )
( )( ) ( ) [ ]
2 1
2 1 2
2 2
1
1 1
2 1
n 1 n 1 pˆ 1 pˆ
n
pˆ 1 pˆ
n
pˆ 1 pˆ
n
pˆ 1 pˆ
n
pˆ 1 pˆ
) pˆ pˆ ( EE + − ·

+

·

+

· −
donde ^ p est á dada por :
2 1
2 2 1 1
n n
n pˆ n pˆ

+
+
·
Manual G- St at 2. 0 95
y represent a una proporción común de individuos que t ienen present e la
car act er íst ica de int er és sin dist inguir por gr upos.
En el caso de que p
0
≠ 0, se t iene que
( ) ( )
2
2 2
1
1 1
2 1
n
pˆ 1 pˆ
n
pˆ 1 pˆ
) pˆ pˆ ( EE

+

· −
pr opor ciona el er r or est ándar de la dif er encia de dos pr opor ciones.
En el caso de pr opor ciones ext r emas conviene usar el mét odo exact o basado
en la dist ribución binomial.
Manej o del programa
Dat os Agr upados: Los dat os necesar ios en el pr ogr ama son:
- Nombr e Gr upo 1: Et iquet a Cat egor ía1.
- Nombr e Gr upo 2: Et iquet a Cat egor ía2.
- Tamaño Gr upo1: Valor de n1.
- Tamaño Gr upo2: Valor de n2.
- Pr opor ción Gr upo1: Valor de p1.
- Pr opor ción Gr upo2: Valor de p2.
z- Pr opor ci ones: Result ados de la est imación y cont r ast e de la
dif er encia de dos pr opor ciones.
Opciones:
- Per mit e cambiar los valor es que por def ect o apar ecen,
Hipót esis nula: 0. 0, Hipót esis alt ernat iva: ( no i gual, menor que,
mayor que) y alfa: 5. 0%.
: Compar ar una pr opor ci ón del 48% con un t amaño de muest r a de
52, f r ent e a una del 28% con un t amaño de muest r a de 47.
96
Ent r ada de dat os par a la compar ación de dos pr opor ciones.
Result ados de la opción compar ación de dos pr opor ciones.
Estimación y Contraste de la Diferencia Poblacional de Dos Proporciones
======================================================================
Tamaños Muestrales: 52 y 47
Proporciones: 0.4800 y 0.2800
Error estándar de las proporciones: 0.0693 y 0.0655
Diferencia de proporciones: 0.2000
Error estándar de la diferencia de proporciones: 0.0953
Estimación
----------
I.C. al 95.00% para la diferencia de dos proporciones:
0.2000 +/- 0.1869 [0.0131, 0.3869]
Contraste z-Proporciones
------------------------
Hipótesis Nula: proporción1-proporción2 = 0.0000
Hipótesis Alternativa: no igual
Estadístico de contraste z: 2.0421
p-valor: 0.0411
Tabl as ( a| b) à Chi - Cuadr ado de Tendenci a Li neal ( y| b)
Realiza la pr ueba Chi- Cuadr ado de t endencia lineal de pr opor ciones de una
variable respuest a dicot ómica ( b) a part ir de los subgrupos formados por una
variable explicat iva discret a cuant it at iva ( y) .
El est adíst ico de cont rast e Chi- Cuadrado de t endencia lineal es un component e
del valor del est adíst ico Chi- Cuadrado para t ablas de frecuencias.
La not ación que se sigue es la de una mat r iz con 2 f ilas y k columnas donde:
Manual G- St at 2. 0 97
Var. en columnas= var. explicat iva X
Var. en filas= var. respuest a x
1
x
2
… x
k
Tot al
1= ” Pr esencia” y
1
y
2
… y
k
y
0= ” Ausencia” (n
1
-y
1
) (n
1
-y
1
) … (n
k
-y
k
) n- y
Tot al n
1
n
2
… n
c
n
El est adíst ico de cont rast e Chi- Cuadrado de t endencia lineal viene dado por
( )
]
]
]
]


,
`

.
|
∑ − −

,
`

.
|
∑ ∑ −
· χ
· ·
· ·
k
1 i
2
k
1 i
i i
2
i i
2
k
1 i
k
1 i
i i i i
2
t
x n x n n y n y
x n y x y n n
que sigue una Chi- Cuadr ado con un gr ado de liber t ad.
Se obser va que las “ et iquet as” de la var iable explicat iva int er vienen en el
cálculo del est adíst ico de cont r ast e, con lo que ést e var iar á si se cambia la
codif icación de la var iable r espuest a.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable Fila y la Variable Columna.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas. En cada celda apar ece en t ér minos absolut os el númer o de
individuos dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Chi - Cuadr ado de Tendenci a Li neal : Cont r ast a la linealidad
( crecient e o decrecient e) de la respuest a en función de la variable
f or mador a de gr upos.
98
: Real i zar l a pr ueba Chi - Cuadr ado de t endenci a l i neal par a
est abl ecer si l a var i abl e Sex o est á r el aci onada l i neal ment e con l a
var i abl e St at us.
Tabla de fr ecuencias
Tabla de Frecuencias de SEXO (filas) por STATUS (columnas)
===========================================================================
Número de Casos: 40
STATUS | 1 | 2 | 3 | Total
SEXO | | | | Fila
-------------------------------------------------------------------
| 10 | 7 | 1 | 18
2 | 58.82 | 63.64 | 8.33 | 45.00
-------------------------------------------------------------------
| 7 | 4 | 11 | 22
1 | 41.18 | 36.36 | 91.67 | 55.00
-------------------------------------------------------------------
Total | 17 | 11 | 12 | 40
Columna | 42.50 | 27.50 | 30.00 | 100.00
Los porcentajes de cada celda se refieren al total de cada columna
Result ados de la prueba Chi- Cuadrado de t endencia lineal.
Chi-Cuadrado de tendencias de SEXO (filas) por STATUS (columnas)
===========================================================================
Tamaño Muestral: 40
Estadístico de contraste Chi-Cuadrado de tendencias: 6.4878
G.L.: 1
p-valor: 0.0109
Tabl as ( a| b) à Chi - Cuadr ado de Tendenci a Li neal . Dat os
Agr upados ( y| b)
A part ir de dat os agrupados se realiza la prueba Chi- Cuadrado de t endencia
lineal de pr opor ciones. Los dat os agr upados se int r oducen dir ect ament e en una
cuadrícula en forma de t abla de ( 2+ 1) filas y c columnas. Los fundament os
t eór icos y la for mulación son idént icos a los pr esent ados en la opción de
análisis ant er ior con dat os a par t ir de un f icher o.
Manual G- St at 2. 0 99
Manej o del programa
Dat os Agr upados: La disposición de la t abla par a la ent r ada de dat os
es la siguient e:
En la pest aña de dat os agr upados hay una cuadr ícula que per mit e la
ent r ada dir ect a del númer o de casos dent r o de cada posible
combinación de cat egorías o niveles. Sólo se puede definir el número
de cat egorías de la variable explicat iva en columnas, ya que la variable
r espuest a siempr e es dicot ómica con valor es de " pr esencia" y
" ausencia" . El bot ón " Crear Tabla" prepara la est ruct ura de la t abla
aj ust ada al númer o de columnas definido. Por defect o apar ecen en la
t abla unos valor es que deben ser sust it uidos por los dat os del usuar io.
Se puede asociar un valor numér ico a las cat egor ías o niveles de la
var iable explicat iva or dinal que va en columnas y que se int r oducen en
la pr imer a f ila de la t abla. En las dos f ilas siguient es de la t abla se
especifican el número de casos para cada nivel de la variable
explicat iva según la pr esencia o ausencia de la var iable r espuest a.
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valores falt ant es, negat ivos, decimales o alfanuméricos. Est e programa
no per mit e t ablas menor es de 2x2.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas. En cada celda apar ece en t ér minos absolut os el númer o de
individuos dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
100
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Chi - Cuadr ado de Tendenci a Li neal : Cont r ast a la linealidad
( crecient e o decrecient e) de la respuest a en función de la variable
f or mador a de gr upos.
Tabl as ( a| b) à Fi sher
Realiza la pr ueba de Fisher que cont r ast a la asociación ent r e dos var iables
dicot ómicas. En el caso de que una de las var iables haga el papel de var iable
respuest a, est amos hablando de la comparación de dos proporciones. Se
emplea par a muest r as pequeñas donde no se da el supuest o de que no haya
más del 20% de las celdas con valor es esper ados menor es de cinco. La pr ueba
de Fisher ut iliza cálculos exact os pues no se calcula la significación mediant e la
apr oximación asint ót ica.
Par a calcular el est adíst ico de cont r ast e, se const r uye la t abla de cont ingencia
de dimensiones 2x2 con las frecuencias absolut as observadas, con la not ación
si gui ent e:
Var 1
Var 2 Cat 1 Cat 2 Tot al
Niv1 a b r
1
Niv2 c d r
2
Tot al c
1
c
2
n
A cont inuación, se const ruyen t odas las t ablas de cont ingencia 2x2 posibles con
celdas a’, b’, c’, d’, siendo 0 ≤ a’ ≤ mín{c
1
, r
1
¦, b’ = r
1
–a’, c’ = c
1
– a’ y d’ = r
2
– c’. A par t ir de dichas t ablas se calcula:
! ' d ! ' c ! ' b ! ' a ! n
! c ! c ! r ! r
p
2 1 2 1
' a
·
donde x! indica el fact orial de x, que se calcula como x! = x· ( x- 1) · ( x- 2) · …· 2· 1,
por ej emplo, 5! = 5· 4· 3· 2· 1= 120.
El p- valor unilat er al izquier do r esult ant e es

≤ a ' a
' a
p
Manual G- St at 2. 0 101
el p- valor unilat eral derecho es

≥ a ' a
' a
p
y el p- valor bilat er al es


a ' a
p p
' a
p
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable Fila y la Variable Columna. En G-
St at , est a pr ueba se r est r inge a var iables dicot ómicas.
Asegur ar se en la pest aña de t ablas que el or den de las cat egor ías es el
deseado. Si no es así, or denar los dat os par a conseguir la disposición
deseada.
Tabl as: Muest r a la t abla de cont ingencia de dos var iables cualit at ivas.
En cada celda apar ece en t ér minos absolut os el númer o de individuos
dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) .
Fi sher : Se present an los result ados de la prueba de Fisher. Present a
los valores de los cont rast es unilat erales y el bilat eral.
Tabl as ( a| b) à Fi sher . Dat os agr upados
Cont rast a la asociación ent re dos variables dicot ómicas mediant e la prueba
exact a de Fisher . Se emplea par a muest r as pequeñas donde no se da el
supuest o de que no haya más del 20% de las celdas con valor es esper ados
menores de cinco. Los dat os se int roducen agrupados en frecuencias en la
cuadrícula correspondient e. Los fundament os t eóricos y la formulación son
idént icos a los pr esent ados en la opción de análisis ant er ior con dat os a par t ir
de un f i cher o.
102
Manej o del programa
Dat os Agr upados: La disposición de la t abla par a la ent r ada de dat os
es la siguient e:
En la pest aña de dat os agr upados hay una cuadr ícula que per mit e la
ent r ada dir ect a del númer o de casos dent r o de cada posible
combinación de cat egor ías o niveles. Las var iables deben ser
dicot ómicas, con lo que la t abla r esult ant e es siempr e dos por dos. Por
def ect o apar ecen en la t abla unos valor es que deben ser sust it uidos por
los dat os del usuar io.
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valores falt ant es, negat ivos, decimales o alfanuméricos. Est e programa
no per mit e t ablas menor es de 2x2.
Asegur ar se en la pest aña de t ablas que el or den de las cat egor ías es el
deseado. Si no es así, or denar los dat os par a conseguir la disposición
deseada.
Tabl as: Muest r a la t abla de cont ingencia de dos var iables cualit at ivas.
En cada celda apar ece en t ér minos absolut os el númer o de individuos
dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Fi sher : Se present an los result ados de la prueba de Fisher. Present a
los valores de los cont rast es unilat erales y el bilat eral.
Manual G- St at 2. 0 103
Tabl as ( a| b) à McNemar
Realiza la pr ueba de McNemar par a dat os par eados que compar a dos
pr opor ciones de dos muest r as par eadas. Es una pr ueba no par amét r ica.
Adicionalment e, t ambién se realiza el cálculo del coeficient e kappa de
concor dancia y de su significación est adíst ica.
Los dat os se expr esan en una t abla de cont ingencia 2x2, donde en cada celda
est án los par es cor r espondient es a cada cr uce de cat egor ía de las dos var iables
dicot ómicas. Los pares discordant es ( fuera de la diagonal principal) son los que
inf luyen en la pr ueba, la not ación es la siguient e:
Var 2
Var 1 Cat 1 Cat 2 Tot al
Cat 1 a b r
1
Cat 2 c d r
2
Tot al c
1
c
2
n
El est adíst ico de cont rast e se const ruye como
( ) ( )
c b
c b
c b
2
1
c b
2
1
c b
2
1
c b
2
1
b
z
+

·
+

·
+
+ −
·
que sigue una dist ribución normal N( 0, 1) . Est e programa proporciona un p-
valor asint ót ico par a est a opción.
Alt ernat ivament e, se puede considerar el est adíst ico de cont rast e:
( )
c b
c b
2
2
+

· χ
que sigue una dist ribución Chi- Cuadrado con un grado de libert ad y que t iene
asociado el mismo p- valor ya que se cumple que
2 2
z χ ·
con lo que ambos pr ocedimient os son equivalent es.
Adicionalment e, el pr ogr ama muest r a el est adíst ico kappa de concor dancia,
que vi ene dado por
104
c
c 0
p 1
p p


· κ
con
n
d a
p
0
+
· ,
2
2 2 1 1
c
n
c r c r
p

·
El est adíst ico de cont rast e se const ruye como
( )
c
c
p 1 n
p
z

κ
·
que sigue una dist ribución normal N( 0, 1) . Est e programa proporciona un p-
valor asint ót ico par a est a opción.
Manej o del programa
Var i abl es: Se i dent i f i ca l a 1º Variable Pareada y l a 2ª Variable
Pareada, ambas dicot ómicas.
Se asume, par a el análisis de los dat os, que la diagonal de
concordancia viene dada por la casilla superior izquierda y la casilla
inferior derecha. Si no es así, ordenar los dat os para conseguir dicha
disposición. La suma de los element os de la diagonal secundaria no
puede ser cer o.
Tabl as: Se muest r a la t abla de cont ingencia de las var iables par eadas.
En cada celda apar ece en t ér minos absolut os el númer o de individuos
dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
McNemar : Se pr esent an los r esult ados de la pr ueba de McNemar y
Kappa.
Manual G- St at 2. 0 105
Tabl as ( a| b) à McNemar . Dat os Agr upados
A par t ir de dat os agr upados se r ealiza la pr ueba McNemar . Adicionalment e,
t ambién se r ealiza el cálculo del coeficient e kappa de concor dancia y de su
significación est adíst ica. Los dat os agrupados se int roducen direct ament e en
una cuadr ícula en f or ma de t abla de 2 f ilas y 2 columnas. Los f undament os
t eór icos y la for mulación son idént icos a los pr esent ados en la opción de
análisis ant er ior con dat os a par t ir de un f icher o.
Manej o del programa
Dat os Agr upados: La di sposi ci ón de l a t abl a par a l a ent r ada de dat os
es la siguient e:
En la pest aña de dat os agr upados hay una cuadr ícula que per mit e la
ent r ada dir ect a del númer o de casos dent r o de cada posible
combinación de cat egor ías o niveles. Las var iables deben ser
dicot ómicas, con lo que la t abla r esult ant e es siempr e dos por dos. Por
def ect o apar ecen en la t abla unos valor es que deben ser sust it uidos por
los dat os del usuar io.
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valor es falt ant es, negat ivos, decimales o alfanumér icos.
Se asume que la diagonal de concor dancia viene dada por la casilla
super ior izquier da y la casilla infer ior der echa. Si no es así, r eor denar
los dat os para conseguir dicha disposición. La suma de los element os
de la diagonal secundar ia no puede ser cer o.
106
Tabl as: Se muest r a la t abla de cont ingencia de las var iables par eadas.
En cada celda apar ece en t ér minos absolut os el númer o de individuos
dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden obt ener los porcent aj es de dichos valores
con r elación al númer o t ot al de individuos en una cat egor ía en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
McNemar : Se pr esent an los r esult ados de la pr ueba de McNemar y
Kappa.
Epi demi ol ogía ( b| b)
Cont iene un submenú con t écnicas de Epidemiología, con las opciones de
Tablas, Tablas ( Dat os Agrupados) y Mant el- Haenszel ( Dat os Agrupados) .
Epi demi ol ogía ( b| b) à Tabl as
Las principales medidas de efect o para variables dicot ómicas en Epidemiología
son el r iesgo r elat ivo RR y el odds r at io OR.
El riesgo relat ivo es válido generalment e en est udios de cohort es, mient ras que
el odds r at io lo es t ant o en est udios de cohor t es como en est udios de casos y
cont r oles. La int er pr et ación par a las dos medidas de efect o es similar :
- el valor uno indica ausencia de efect o
- valor es super ior es a uno, fact or de r iesgo
- valor es inf er ior es a uno, f act or pr ot ect or
La not ación que se ut iliza es la siguient e:
Fact or de exposición
Enf er medad Sí No Tot al
Sí a b r
1
No c d r
2
Tot al c
1
c
2
n
Manual G- St at 2. 0 107
En el caso de celdas vacías, se suma 0. 5 en t odas las celdas par a evit ar
pr oblemas de cálculo en las medidas de ef ect o.
El odds r at io en est udios pr ospect ivos se define por :
( )
( )
( )
( ) Expuest os No Enf er medad Pr ob 1
Expuest os No Enf er medad Pr ob
Expuest os Enf er medad Pr ob 1
Expuest os Enf er medad Pr ob
OR


·
En est udios r et r ospect ivos se def ine como:
( )
( )
( )
( ) Enf er mos No Expuest os Pr ob 1
Enf er mos No Expuest os Pr ob
Enf er mos Expuest os Pr ob 1
Enf er mos Expuest os Pr ob
OR


·
Se demuest r a que ambas expr esiones son equivalent es, por lo que la
est imación del OR par a est udios pr ospect ivos y r et r ospect ivos es la misma y
vi ene dada por
c b
d a
OR


·
Para det erminar el I C( OR) es convenient e t rabaj ar con el t ransformado
logar ít mico del OR, par a lo cual es necesar io calcular
d
1
c
1
b
1
a
1
) LnOR ( EE + + + ·
con l o que:
( ) ( ) ( ) ( ) ( ) LnOR EE 96 . 1 LnOR exp ; LnOR EE 96 . 1 LnOR exp ) OR %( 95 I C ⋅ + ⋅ − ·
da el int er valo de confianza del OR dir ect ament e.
La signif icación del OR viene dada por la pr ueba Chi- Cuadr ado que en el caso
de una t abla 2x2 t iene la siguient e expr esión:
( )
2 1 2 1
2
2
c c r r
n c b d a −
· χ
que sigue una dist r ibución χ
2
con ( 2 - 1) x( 2 - 1) = 1 gr ado de liber t ad.
El r iesgo r elat ivo sólo t iene sent ido calcular lo en est udios pr ospect ivos, y se
define como
108
( )
( ) Expuest os No Enf er medad ob Pr
Expuest os Enf er medad ob Pr
RR ·
y que se est i ma por
1
2
c b
c a
RR


·
Para det erminar el I C( RR) es convenient e t rabaj ar con el t ransformado
logar ít mico del RR, par a lo cual es necesar io calcular
2 1
c
1
b
1
c
1
a
1
) LnRR ( EE − + − ·
con lo que
( ) ( ) ( ) ( ) ( ) LnRR EE 96 . 1 LnRR exp ; LnRR EE 96 . 1 LnRR exp ) RR %( 95 I C ⋅ + ⋅ − ·
da el int er valo de confianza del RR dir ect ament e.
La significación del RR es la misma que la significación del OR.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable Respuest a ( resolución) que
apar ecer á en f ilas y la Variable Explicat iva ( fact or de exposición) que
apar ecer á en columnas, ambas dicot ómicas.
Tabl as: Se muest r a la t abla de cont ingencia de dos var iables
cualit at ivas dicot ómicas. En cada celda aparece en t érminos absolut os
el número de individuos dent ro de cada posible combinación de
cat egor ías.
Adicionalment e, se pueden dar los por cent aj es de dichos valor es con
relación al número t ot al de individuos en una cat egoría en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Si la variable explicat iva ( fact or de exposición) se localiza en la variable
columna, los porcent aj es por columnas corresponden a los porcent aj es
( r iesgos) de los gr upos expuest os y no expuest os.
RR y OR: Se pr esent an las pr incipales medidas de efect o par a
variables dicot ómicas en Epidemiología: el Riesgo Relat ivo RR y el Odds
Manual G- St at 2. 0 109
Rat io OR. Adicionalment e se facilit an los int er valos de confianza par a el
riesgo relat ivo poblacional y el odds rat io poblacional. El nivel de
confianza se puede modificar en la vent ana de opciones consider ándolo
= ( 1- alfa) .
Chi - Cuadr ado: Se cont r ast a la independencia ent r e la var iable
explicat iva ( fact or de exposición) y la variable respuest a o resolución,
mediant e la prueba de Chi- Cuadrado. Se cont rast a si los valores
poblacionales de las medidas de efect o ( RR y OR) son difer ent es de 1.
Epi demi ol ogía ( b| b) à Tabl as. Dat os Agr upados
A par t ir de dat os agr upados se calculan las medidas de efect o básicas en
Epidemiología. Los dat os agr upados se int r oducen dir ect ament e en una
cuadrícula en forma de t abla de 2 filas y 2 columnas. Los fundament os t eóricos
y la for mulación son idént icos a los pr esent ados en la opción de análisis
ant er ior con dat os a par t ir de un f icher o. En el caso de celdas vacías, se suma
0. 5 en t odas las celdas par a evit ar pr oblemas de cálculo en las medidas de
ef ect o.
Manej o del programa
Dat os Agr upados: La di sposi ci ón de l a t abl a par a l a ent r ada de dat os
es la siguient e:
La cuadrícula permit e la ent rada direct a del número de casos dent ro
de cada posible combinación de cat egor ías o niveles. Las var iables
deben ser dicot ómicas, con lo que la t abla es dos por dos. La t abla
est á definida por las frecuencias de respuest as posit ivas y negat ivas
par a los gr upos de expuest os y no expuest os. Por defect o apar ecen en
l a t abl a unos val or es que deben ser sust i t ui dos por l os dat os del
usuar io.
110
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valor es falt ant es, negat ivos, decimales o alfanumér icos.
Tabl as: Se muest r a la t abla de cont ingencia de las dos var iables
dicot ómicas . En cada celda apar ece en t ér minos absolut os el númer o
de individuos dent r o de cada posible combinación de cat egor ías.
Adicionalment e, se pueden dar los por cent aj es de dichos valor es con
relación al número t ot al de individuos en una cat egoría en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Si la variable explicat iva ( fact or de exposición) se localiza en la variable
columna, los porcent aj es por columnas corresponden a los porcent aj es
( r iesgos) de los gr upos expuest os y no expuest os.
RR y OR: Se pr esent an las pr incipales medidas de efect o par a
variables dicot ómicas en Epidemiología: el Riesgo Relat ivo RR y el Odds
Rat io OR. Adicionalment e se facilit an los int er valos de confianza par a el
riesgo relat ivo poblacional y el odds rat io poblacional. El nivel de
confianza se puede modificar en la vent ana de opciones consider ándolo
= ( 1- alfa) .
Chi - Cuadr ado: Se cont r ast a la independencia ent r e la var iable
explicat iva ( fact or de exposición) y la variable respuest a o resolución,
mediant e la prueba de Chi- Cuadrado. Se cont rast a si los valores
poblacionales de las medidas de efect o ( RR y OR) son difer ent es de 1.
Epi demi ol ogía ( b| b) à Mant el - Haenszel . Dat os Agr upados
( c| ( b| b) )
Realiza la pr ueba de Mant el- Haenszel que combina infor mación en
Epidemiología de var ias t ablas 2x2 que est udian el mismo fact or de exposición
y la misma r esolución o r espuest a. Est a t écnica j unt o con la met odología Logit ,
son las t écnicas básicas que se ut ilizan en Met a- Análisis.
La not ación int er na que ut iliza el pr ogr ama es la de k t ablas 2x2 de la for ma
siguient e, con k el número de t ablas o est udios ( niveles) que hay que
combinar, y j = 1, …, k:
Manual G- St at 2. 0 111
Fact or de exposición
Respuest a Sí No Tot al
Sí a
j
b
j
r
1j
No c
j
d
j
r
2j
Tot al s
1j
s
2j
n
j
Est a not ación int er na se pr esent a en el int er f az de ent r ada de la f or ma:
Nivel 1 Nivel 2 Nivel j Nivel k
Res + / Exp+ a
1
a
2
a
j
a
k
Res+ / Exp- b
1
b
2
b
j
b
k
Res- / Exp+ c
1
c
2
c
j
c
k
Res- / Exp- d
1
d
2
d
j
d
k
Las fór mulas par a el cálculo en cada nivel del Riesgo Relat ivo, Odds Rat io y
Chi- 2 de significación son las descr it as en la opción ant er ior de Epidemiología.
Las fórmulas del Riesgo Relat ivo Mant el- Haenszel, Odds Rat io Mant el- Haenszel
y Chi- 2 Mant el- Haenszel de significación se descr iben a cont inuación.
Asimismo, se dan las fór mulas par a calcular la homogeneidad de los est udios o
niveles. Si se rechaza la hipót esis nula de homogeneidad ( y se concluya
het erogeneidad) , los valores est imados por Mant el- Haenszel son cuest ionables.
Ri esgo Rel at i vo Mant el - Haenszel
El riesgo relat ivo Mant el- Haenszel se calcula como


·
·
·
k
1 j
j
j 1 j
k
1 j
j
j 2 j
MH
n
s b
n
s a
RR
Par a det er minar el I C( RR
MH
) es convenient e t rabaj ar con el t ransformado
logarít mico del RR
MH
, par a lo cual es necesar io calcular
112
]
]
]
]


]
]
]
]




·
· ·
·
k
1 j
j
j 1 j
k
1 j
j
j 2 j
k
1 j
2
j
j j j j 2 j 1 j 1
MH
n
s b
n
s a
n
n b a s s r
) LnRR ( EE
con lo que el I C95%( RR
MH
) viene dado dir ect ament e por
( ) ( ) ( ) ( ) ( )
MH MH MH MH
LnRR EE 96 . 1 LnRR exp ; LnRR EE 96 . 1 LnRR exp ⋅ + ⋅ −
Odds Rat i o Mant el - Haenszel
El odds rat io Mant el- Haenszel se calcula como


·
·
·
k
1 j
j
j j
k
1 j
j
j j
MH
n
c b
n
d a
OR
Par a det er minar el I C( OR
MH
) es convenient e t rabaj ar con el t ransformado
logarít mico del RR
MH
, par a lo cual es necesar io calcular
3 2 1 MH
Aux Aux Aux ) LnOR ( EE + + ·
siendo
2
k
1 j
j
j j
k
1 j
j
j j
j
j j
1
n
d a
2
n
d a
n
d a
Aux
]
]
]
]


,
`

.
|

,
`

.
| +
·
·
·
]
]
]
]


]
]
]
]


,
`

.
|

,
`

.
| +
+

,
`

.
|

,
`

.
| +
·
· ·
·
k
1 j
j
j j
k
1 j
j
j j
k
1 j
j
j j
j
j j
j
j j
j
j j
2
n
c b
n
d a
2
n
d a
n
c b
n
c b
n
d a
Aux
2
k
1 j
j
j j
k
1 j
j
j j
j
j j
3
n
c b
2
n
c b
n
c b
Aux
]
]
]
]


,
`

.
|

,
`

.
| +
·
·
·
Manual G- St at 2. 0 113
con lo que el I C95%( OR
MH
) viene dado dir ect ament e por
( ) ( ) ( ) ( ) ( )
MH MH MH MH
LnOR EE 96 . 1 LnOR exp ; LnOR EE 96 . 1 LnOR exp ⋅ + ⋅ −
Homogenei dad de Ri esgos Rel at i vos
Se const ruyen k t ablas 2x2 fict icias que t engan por RR
j
el mismo RR
MH
en cada
est udio o nivel j , j = 1, …, k, de la f or ma siguient e:
Fact or de exposición
Respuest a Sí No Tot al
Sí a*
j
b*
j
r
1j
No c*
j
d*
j
r
2j
Tot al s
1j
s
2j
n
j
con
j 1
*
j
j 2
*
j
MH
s b
s a
RR ·
Se pl ant ea una ecuaci ón l i neal en a*
j
y de di cha ecuaci ón se r esuel ven el val or
del r est o de las celdas:
( )
j 1
*
j j 1
j 2
*
j
MH
s a r
s a
RR

·
j 1 MH j 2
MH j 1 j 1 *
j
s RR s
RR s r
a
+
·
*
j j 1
*
j
a r b − ·
*
j j 1
*
j
a s c − ·
( )
*
j j 1 j 2
*
j
a s r d − − ·
A part ir de est os valores se const ruye el siguient e est adíst ico de homogeneidad
( ) ( ) ( ) ( )

]
]
]
]


+

+

+

·
k
1 j
*
j
2
*
j j
*
j
2
*
j j
*
j
2
*
j j
*
j
2
*
j j
d
d d
c
c c
b
b b
a
a a
114
Est e est adíst ico se ha def inido de f or ma análoga al est adíst ico de
homogeneidad de Br eslow- Day par a odds r at io y est á en fase exper iment al de
est udio, per o siguiendo la analogía con Br eslow- Day, seguir á una dist r ibución
chi- cuadr ado con 1 gr ado de liber t ad.
Est e est adíst ico de homogeneidad puede dar valor es negat ivos, en esos caso el
pr ogr ama escr ibe en los r esult ados “ No Aplicable” .
Homogenei dad Br esl ow - Day de Odds Rat i os
Se const r uyen k t ablas 2x2 fict icias que t engan por OR
j
el mi smo OR
MH
en cada
est udio o nivel j , j = 1, …, k, de la for ma siguient e
Fact or de exposición
Respuest a Sí No Tot al
Sí a*
j
b*
j
r
1j
No c*
j
d*
j
r
2j
Tot al s
1j
s
2j
n
j
con
*
j
*
j
*
j
*
j
MH
c b
d a
OR ·
Se plant ea una ecuación cuadrát ica en a*
j
y de dicha ecuación se r esuelven el
valor del r est o de las celdas:
( ) [ ]
[ ] [ ]
*
j j 1
*
j j 1
*
j j 1 j 2
*
j
MH
a s a r
a s r a
OR
− −
− −
·
( ) ( ) 0 s r OR OR r OR s r s a 1 OR a
j 1 j 1 MH MH j 1 MH j 1 j 2 j 1
*
j MH
2
*
j
· + − − − + −
( )
( ) 1 OR 2
AUX OR r OR s r s
a
MH
1 MH j 1 MH j 1 j 2 j 1 *
j

t − − − −
·
( ) ( )
j 1 j 1 MH MH
2
MH j 1 MH j 1 j 2 j 1 1
s r OR 1 OR 4 OR r OR s r s AUX − − − − − ·
*
j j 1
*
j
a r b − ·
*
j j 1
*
j
a s c − ·
( )
*
j j 1 j 2
*
j
a s r d − − ·
Manual G- St at 2. 0 115
La solución de la ant er ior ecuación par a a*
j
ser á aquella que ver if ique a*
j
≥0,
a*
j
≤r
1j
y a*
j
≤s
1j
.
A par t ir de est os valor es se const r uye el est adíst ico Br eslow- Day de
homogeneidad
( ) ( ) ( ) ( )

]
]
]
]


+

+

+

·
k
1 j
*
j
2
*
j j
*
j
2
*
j j
*
j
2
*
j j
*
j
2
*
j j
d
d d
c
c c
b
b b
a
a a
Est e est adíst ico sigue una dist r ibución chi- cuadr ado con 1 gr ado de liber t ad.
Chi - Cuadr ado Mant el - Haenszel
El est adíst ico Chi- Cuadrado Mant el- Haenszel se calcula como
( ) ( )
[ ] ∑
]
]
]

∑ −
· χ
·
·
k
1 j
j
2
k
1 j
j j
2
MH
a V
a E a
que sigue una dist r ibución Chi- Cuadr ado con un gr ado de liber t ad, siendo
[ ]
j
j 1 j 1
j
n
s r
a E ·
[ ]
( ) 1 n n
s s r r
a V
j
2
j
j 2 j 1 j 2 j 1
j

·
Manej o del programa
Dat os Agr upados: La di sposi ci ón de l a t abl a par a l a ent r ada de dat os
es la siguient e:
116
La cuadr ícula per mit e la ent r ada dir ect a de las fr ecuencias de
r espuest as posit ivas y negat ivas par a los gr upos de expuest os y no
expuest os. Se puede definir el númer o de est udios o niveles de la
var iable de est r at if icación. Cada columna est á asociada a un est udio. El
bot ón " Cr ear " pr epar a la est r uct ur a de la t abla aj ust ada al númer o de
est udios. Por def ect o apar ecen en la t abla unos valor es que deben ser
sust it uidos por los dat os del usuar io.
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valor es falt ant es, negat ivos, decimales o alfanumér icos.
RR, OR y si gni f i caci ón: Se pr esent a par a cada nivel de la var iable
f or mador a de capas, las medidas de ef ect o RR y OR, así como su
int ervalo de confianza y su significación global.
Di agnóst i co ( b| b)
Cont iene un submenú con t écnicas de Diagnóst ico, con las opciones de Tablas,
Tablas ( Dat os Agrupados) y curvas ROC ( “ Receiver Operat ing Charact erist ic
curves” ) .
Di agnóst i co ( b| b) à Tabl as
En est a opción se descr iben las t écnicas de diagnóst ico que int ent an est udiar el
compor t amient o de un t est o pr ueba diagnóst ica ( que se consider a como
var iable explicat iva) en r elación a si pr onost ica bien o mal, en un suj et o, la
pr esencia o ausencia de una “ enfer medad” ( que se consider a como var iable
respuest a) . Est a variable que se int ent a pronost icar se conoce t ambién como
“ Est ado de la nat ur aleza ( EN) ” , que r epr esent a la ver dader a condición del
suj et o. Se supone que el t est o pr ueba diagnóst ico, al igual que el EN, t iene
como posibles r esult ados el valor posit ivo y negat ivo.
La not ación que se ut iliza es la siguient e:
Manual G- St at 2. 0 117
Test
EN + - Tot al
+ a b r
1
- c d r
2
Tot al c
1
c
2
n
Los valor es a y d r epr esent an a aquellos individuos que son pr onost icados
cor r ect ament e. Los índices de fiabilidad diagnóst ica que se calculan son:
sensibilidad, especificidad, valores predict ivos de ocurrencia para cada
r esult ado del t est , likelihood r at io y odds r at io.
En est udios t r ansver sales ( donde no se pr efij a ningún mar ginal r
1
, r
2
, c
1
ó c
2
,
sólo se pr ef ij a n) se puede calcular la pr evalencia muest r al, que viene dada por
n
r
a Pr eval enci
1
·
Algunos de los índices de fiabilidad diagnóst ica no dependen de la prevalencia
t eór ica, ot r os, sin embar go sí. En los casos en que sí dependa y se est é en un
est udio t r ansver sal, es necesar io t ener una est imación ( por ot r os est udios,
referencias bibliográfica) de la prevalencia t eórica. Est a est imación se denot a
por Pr ev.
Sensi bi l i dad y especi f i ci dad
La sensibilidad y la especificidad de un t est se calculan como
1
r
a
Sens ·
2
r
d
Espe ·
La sensibilidad r epr esent a la pr obabilidad de t est posit ivo en el gr upo EN
posit ivo ( aciert o en “ enfermos” ) y la sensibilidad la probabilidad de t est
negat ivo en el gr upo EN negat ivo ( acier t o en “ sanos” ) . La sensibilidad y la
especificidad no dependen de la pr evalencia.
El cálculo de los int ervalos de confianza de la sensibilidad y de la especificidad
se r ealizan t eniendo en cuent a que son pr opor ciones, por lo que se ut ilizan las
fór mulas descr it as en la opción Análisis / Cualit at iva / Una Pr opor ción.
118
Val or es pr edi ct i vos
Los valores predict ivos de “ enfermedad” de un t est se calculan como
1
c
a
VP · +
2
c
b
VP · −
El VP+ r epr esent a la Pr ob( EN posit ivo | t est posit ivo) , es decir la pr obabilidad
de EN posit ivo en el gr upo de t est posit ivo. El VP- r epr esent a la Pr ob( EN
posit ivo | t est negat ivo) , es decir la probabilidad de EN posit ivo en el grupo de
t est negat ivo. Los valores predict ivos de “ enfermedad” dependen de la
prevalencia. Est o quiere decir que en est udios t ransversales las fórmulas
ant er ior es son cor r ect as par a el cálculo de VP+ y VP- . En el caso de est udios no
t r ansver sales es necesar io calcular los a par t ir de Pr ev y de los Likelihood r at io,
según se ver á a cont inuación.
El cálculo de los int er valos de conf ianza de los valor es pr edict ivos se dar á en el
caso gener al a par t ir de Pr ev y de los Likelihood r at io.
Li k el i hood r at i o
Los Likelihood r at io de “ enfer medad” de un t est se calculan como
Espe 1
Sens
) ( L

· +
Espe
Sens 1
) ( L

· −
Los Likelihood r at io de “ enfer medad” no dependen de la pr evalencia.
Para det erminar el I C( L( + ) ) es convenient e t rabaj ar con el t ransformado
logar ít mico del L( + ) , par a lo cual es necesar io calcular
c
Espe
a
Sens 1
)) ( LnL ( EE +

· +
con lo que el I C95%( L( + ) ) viene dado dir ect ament e por
( ) ( ) ( ) ( ) ( ) ) ( LnL EE 96 . 1 ) ( LnL exp ; ) ( LnL EE 96 . 1 ) ( LnL exp + ⋅ + + + ⋅ − +
Para det erminar el I C( L( - ) ) es convenient e t rabaj ar con el t ransformado
logar ít mico del L( - ) , par a lo cual es necesar io calcular
Manual G- St at 2. 0 119
d
Espe 1
b
Sens
)) ( LnL ( EE

+ · −
con lo que el I C95%( L( - ) ) viene dado dir ect ament e por
( ) ( ) ( ) ( ) ( ) ) ( LnL EE 96 . 1 ) ( LnL exp ; ) ( LnL EE 96 . 1 ) ( LnL exp − ⋅ + − − ⋅ − −
A par t ir de los Likelihood r at io y de Pr ev se pueden calcular VP+ y VP- en
est udios no t r ansver sales, de la for ma siguient e:
( )
Pr ev 1 ) ( L Pr ev
) ( L Pr ev
Test | EN Pr ob VP
− + + ⋅
+ ⋅
· + + · +
( )
Pr ev 1 ) ( L Pr ev
) ( L Pr ev
Test | EN Pr ob VP
− + − ⋅
− ⋅
· − + · −
Par a det er minar el I C( VP+ ) es necesar io calcular
( )( )
( ) ( ) ( )
( )
2 2 2
Pr ev 1 Pr ev
Pr ev EE
I nes
I nes EE
Sens
Sens EE
VP 1 VP ) VP ( EE

,
`

.
|

+

,
`

.
|
+

,
`

.
|
+ − + · +
siendo
Espe 1 I nes − ·
( )
1
1 1
r
r
a
1
r
a
Sens EE

,
`

.
|

·
( )
2
2 2
r
r
d
r
d
1
I nes EE

,
`

.
|

·
( )
( )
n
Pr ev 1 Pr ev
ev Pr EE

·
con lo que el I C95%( VP+ ) viene dado por
( ) ( ) ( ) + ⋅ + + + ⋅ − + VP EE 96 . 1 ) VP ( ; VP EE 96 . 1 ) VP (
Par a det er minar el I C( VP- ) es necesar io calcular
( )( )
( ) ( ) ( )
( )
2 2 2
v Pr e 1 Pr ev
Pr ev EE
I nes
I nes EE
Sens
Sens EE
VP 1 VP ) VP ( EE

,
`

.
|

+

,
`

.
|
+

,
`

.
|
− − − · −
120
con lo que el I C95%( VP- ) viene dado por
( ) ( ) ( ) − ⋅ + − − ⋅ − − VP EE 96 . 1 ) VP ( ; VP EE 96 . 1 ) VP (
Odds r at i o
El cálculo del odds rat io y de su int ervalo de confianza se realiza según las
fór mulas dadas en la opción de Epidemiología. Obser var , no obst ant e, que
) ( L
) ( L
OR

+
·
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a " Est ado de la nat uraleza"
( EN) o ver dader a condición del suj et o en f ilas y la Variable explicat iva
“ result ado del Test ” ( prueba diagnóst ica) en columnas, ambas
dicot ómicas.
En las pest añas post eriores de Tablas y Diagnóst ico habrá que
comprobar que la diagonal de concordancia viene dada por la casilla
superior izquierda y la casilla inferior derecha y que, adicionalment e,
los r esult ados posit ivos del Est ado de la nat ur aleza y del Test deben
est ar sit uados en la casilla super ior izquier da. Si no es así, or denar los
dat os par a conseguir dicha disposición.
Tabl as: Se muest ra la t abla de cont ingencia dos por dos de dos
var iables cualit at ivas dicot ómicas. En cada celda apar ece en t ér minos
absolut os el númer o de casos dent r o de cada posible combinación de
cat egor ías.
Adicionalment e, se pueden dar los por cent aj es de dichos valor es con
relación al número t ot al de individuos en una cat egoría en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Di agnóst i co: Apar ecen los índices de fiabilidad diagnóst ica,
sensibilidad, especificidad, valores predict ivos de ocurrencia para cada
result ado del t est , likelihood rat io y odds rat io. Asimismo, se present a
la pr evalencia en la muest r a.
Manual G- St at 2. 0 121
La pr evalencia se puede modelizar en las opciones. Los valor es
predict ivos dependen del valor de la prevalencia muest ral, la
especificidad y la sensibilidad no.
Se incluyen los int er valos de conf ianza. En las opciones, el valor por
def ect o de alf a es 5% que cor r esponde a un I C del 95%.
Chi - Cuadr ado: Se cont r ast a la independencia ent r e el r esult ado del
Test y la variable Est ado de la nat uraleza EN, mediant e la prueba de
Chi- Cuadrado. Est e t ipo de cont rast e no suele ut ilizarse en diagnóst ico
puest o que nor malment e, aun siendo est adíst icament e signif icat ivo el
result ado, muchas veces los índices o medidas de fiabilidad diagnóst ica
no son suficient ement e adecuados.
Di agnóst i co ( b| b) à Tabl as. Dat os Agr upados
A par t ir de dat os agr upados se calculan las t écnicas est adíst icas básicas
ut ilizadas en Diagnóst ico. Los dat os agr upados se int r oducen dir ect ament e en
una cuadr ícula en f or ma de t abla de 2 f ilas y 2 columnas. Los f undament os
t eór icos y la for mulación son idént icos a los pr esent ados en la opción de
análisis ant er ior con dat os a par t ir de un f icher o.
Manej o del programa
Dat os Agr upados: La disposición de la t abla par a la ent r ada de dat os
es la siguient e:
La cuadrícula permit e la ent rada direct a del número de casos dent ro
de cada posible combinación de cat egor ías o niveles. Las var iables
deben ser dicot ómicas, con lo que la t abla es de dos por dos. La t abla
est á def inida por las f r ecuencias de r esult ados del Test posit ivos y
negat ivos par a los dos Est ados de la nat ur aleza. Por defect o apar ecen
122
en la t abla unos valor es que deben ser sust it uidos por los dat os del
usuar io.
Se asume que la diagonal de concor dancia viene dada por la casilla
superior izquierda y la casilla inferior derecha. Adicionalment e, los
r esult ados posit ivos del Est ado de la nat ur aleza y del Test deben est ar
sit uados en la casilla super ior izquier da. Si no es así, r eor denar los
dat os par a conseguir dicha disposición.
No dej ar en la t abla filas o columnas con t odos los valor es falt ant es o
con t odos los valor es iguales a cer o. Las celdas de la t abla no admit en
valores falt ant es, negat ivos, decimales o alfanuméricos. La suma de
fr ecuencias de la diagonal de discor dancias no deber ía ser cer o.
Tabl as: Se muest ra la t abla de cont ingencia dos por dos de dos
var iables cualit at ivas dicot ómicas. En cada celda apar ece en t ér minos
absolut os el númer o de casos dent r o de cada posible combinación de
cat egor ías.
Adicionalment e, se pueden dar los por cent aj es de dichos valor es con
relación al número t ot al de individuos en una cat egoría en fila
( porcent aj es fila) , en una cat egoría en columna ( porcent aj es columna)
y del t ot al de individuos ( porcent aj e t ot al) . El programa calcula, por
def ect o, los por cent aj es r ef er idos al t ot al de la t abla.
Di agnóst i co: Apar ecen los índices de fiabilidad diagnóst ica,
sensibilidad, especificidad, valores predict ivos de ocurrencia para cada
result ado del t est , likelihood rat io y odds rat io. Asimismo, se present a
la pr evalencia en la muest r a.
La pr evalencia se puede modelizar en las opciones. Los valor es
predict ivos dependen del valor de la prevalencia muest ral, la
especificidad y la sensibilidad no dependen.
Se incluyen los int er valos de conf ianza. En las opciones, el valor por
def ect o de alf a es 5% que cor r esponde a un I C del 95%.
Chi - Cuadr ado: Se cont r ast a la independencia ent r e el r esult ado del
Test y la variable Est ado de la nat uraleza EN, mediant e la prueba de
Chi- Cuadrado. Est e t ipo de cont rast e no suele ut ilizarse en diagnóst ico
puest o que nor malment e, aun siendo est adíst icament e signif icat ivo el
result ado, muchas veces los índices o medidas de fiabilidad diagnóst ica
no son suficient ement e adecuadas.
Manual G- St at 2. 0 123
Di agnóst i co ( b| b) à ROC ( y| b)
Realiza el cálculo de las cur vas ROC o cur vas de r endimient o diagnóst ico, que
son t écnicas de diagnóst ico que int ent an est udiar el compor t amient o de un t est
o pr ueba diagnóst ica cuant it at iva ( que se consider a como var iable explicat iva)
en r elación a si pr onost ica bien o mal, en un suj et o, la pr esencia o ausencia de
una “ enfermedad” ( que se considera como variable respuest a) . Est a variable
que se int ent a pronost icar se conoce t ambién como “ Est ado de la nat uraleza
( EN) ” , que r epr esent a la ver dader a condición del suj et o. A difer encia de las
opciones ant er ior es de Diagnóst ico, se supone que el t est o pr ueba diagnóst ico
es cuant it at iva en vez de dicot ómica. El EN sigue siendo dicot ómica.
Est a t écnica se basa en discr et izar la var iable explicat iva en t r amos. Par a ello
se ordenan de menor a mayor los dist int os valores que t oma la variable
explicat iva, que se denot an por x
1
, x
2
, …, x
k
. Los t r amos que se consider an son
los dados por los punt os de cor t e:
<x
1
, ( x
1
+x
2
) / 2, …, ( x
k- 1
+x
k
) / 2, > x
k
En cada punt o de cor t e p
c
se const r uye una t abla 2x2 de la for ma siguient e:
Test
EN Test > = p
c
Test < p
c
Tot al
+ a
j
b
j
r
1j
- c
j
d
j
r
2j
Tot al c
1j
c
2j
n
j
donde Test > = p
c
se int erpret a como un t est que da result ado posit ivo y Test < p
c
se int erpret a como un t est que da result ado negat ivo. Se t iene, por t ant o, que
a
j
: Verdaderos posit ivos, EN+ y Test +
b
j
: Falsos negat ivos, EN+ y Test -
c
j
: Falsos posit ivos, EN- y Test +
d
j
: Verdaderos negat ivos, EN- y Test -
En cada una de est as t ablas se calcula la Sens
j
y la ( 1- Espe)
j
con j = 1, …, k. La
cur va ROC es la r epr esent ación gr áf ica de est os valor es obt enidos, donde en el
ej e hor izont al se r epr esent a 1- Especificidad y en el ej e ver t ical la Sensibilidad.
El Ár ea baj o la cur va ( ABC) de est a cur va ROC da una medida del gr ado de
r ent abilidad diagnóst ica del Test . El ABC var ía ent r e 0 y 1. Valor es cer canos a
0. 5 implican ausencia de r ent abilidad diagnóst ica. Valor es menor es de 0. 5 del
ABC indican diagnóst icos inver sos.
124
El ár ea baj o la cur va ROC se calcula por el mét odo t r apezoidal de la for ma
si gui ent e:
( ) ( ) ( ) ∑

,
`

.
| −
+ − − −
·

− −
k
1 j
1 j j
1 j 1 j j
2
Sens Sens
Sens Espe 1 Espe 1
El punt o de pr obabilidad de cor t e ópt imo par a a par t ir del valor de la var iable
explicat iva det er minar la ocur r encia de la var iable r espuest a, ser á aquel en
donde la cur va más se acer ca a la esquina super ior izquier da del gr áfico, que
es el punt o con Sensibilidad y Especificidad igual a 1.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a dicot ómica " Est ado de la
nat ur aleza" ( EN) o ver dader a condición del suj et o y la Variable
explicat iva cuant it at iva “ result ado del Test ” ( prueba diagnóst ica) .
ROC Tabl a: Para la variable cuant it at iva Test se generan sucesivos
punt os de cort e. Una vez dicot omizada la variable explicat iva
cuant it at iva se calculan los índices diagnóst icos Sensibilidad y 1-
Especificidad par a los difer ent es cor t es. El ABC se est ima por el mét odo
t rapezoidal, indicándose las Areas baj o la Curva parciales. El ABC
global se pr esent a al f inal de las ABC par ciales y en la pest aña ROC
Gr áf ico.
En opciones se ident if ica el código del EN r elacionado con el valor
posit ivo, gener alment e " enfer medad” .
ROC Gr áf i co: Se muest r a la cur va ROC que es la r epr esent ación
gráfica de los valores obt enidos según se indica en la pest aña ROC
Tabla, donde en el ej e hor izont al se r epr esent a 1- Especificidad y en el
ej e ver t ical la Sensibilidad.
En opciones se ident if ica el código del EN r elacionado con el valor
posit ivo, generalment e " enfermedad" , los t ít ulos y los valores mínimo y
máximo de los ej es. Est as opciones son independient es de las de la
pest aña ROC Tabla y deberán igualarse para obt ener result ados
compat ibles.
Manual G- St at 2. 0 125
Dos Gr upos ( b| y)
Cont iene un submenú con diferent es t écnicas est adíst icas para una variable
explicat iva dicot ómica o binar ia ( b) que int ent a explicar una var iable explicat iva
cuant it at iva ( y) . Se incluyen las siguient es pruebas: t - St udent , t - St udent para
dat os par eados, F- Snedecor , t - St udent y F- Snedecor par a dat os agr upados,
Mann- Whit ney ( Wilcoxon) , Wilcoxon para dat os pareados y Signos para dat os
par eados.
Dos Gr upos ( b| y) à t - St udent
Realiza el int er valo de confianza del par ámet r o difer encia poblacional de dos
medias y un cont r ast e de hipót esis de dos medias mediant e la pr ueba t -
St udent .
Par a calcular el I C( 1 - α) % para la diferencia de medias suponiendo igualdad
de var ianzas, se necesit a calcular el er r or est ándar de la difer encia de medias
que, en el supuest o de igualdad de var ianzas, t iene la expr esión
( )

,
`

.
|
+ · −
2 1
2
2 1
n
1
n
1
s x x EE
siendo 2 1 x y x las medias por cada gr upo y s
2
la varianza conj unt a ( “ pooled
var iance” ) , que t iene por expr esión
( ) ( )
( ) ( ) 1 n 1 n
s 1 n s 1 n
s
2 1
2
2 2
2
1 1 2
− + −
− + −
·
siendo
2
2
2
1
s y s las var ianzas muest r ales par a cada gr upo. En segundo lugar
par a calcular el I C deseado se necesit a el valor de la t - St udent t
1- α/ 2; gl
con
grados de libert ad gl = ( n
1
- 1) + (n
2
– 1) = (n
1
+ n
2
– 2) , con l o que
( ) ( ) ( ) ( ) [ ] 2 1
gl , 2 / 1
2 1 2 1 x x EE t x x x x % 1 I C − t − · − α −
α −
pr opor ciona el I C buscado.
Par a calcular el I C( 1 - α) % par a la difer encia de medias suponiendo no
igualdad de varianzas, se necesit a calcular el error est ándar de la diferencia de
medias que, en el supuest o de no igualdad de var ianzas, t iene la expr esión
126
( ) ( ) ( )
2
2
2
1
2
1
2
2
2
1 2 1
n
s
n
s
x EE x EE x x EE + · + · −
En segundo lugar , par a calcular el I C deseado se necesit a el valor de la t -
St udent t
1- α/ 2; gl
con gr ados de liber t ad gl dados por la siguient e expr esión,
llamada de Sat t ert hwait e
( ) [ ]
( ) [ ] ( ) [ ]
4
2
2
4
1
1
4
2 1
x EE
1 n
1
x EE
1 n
1
x x EE
gl

+


·
con lo que
( ) ( ) ( ) ( ) [ ] 2 1
gl , 2 / 1
2 1 2 1 x x EE t x x x x % 1 I C − t − · − α −
α −
pr opor ciona el I C buscado.
Para llevar a cabo el cont rast e
H
0
: µ
1
- µ
2
= 0
H
1
: µ
1
- µ
2
≠ 0
suponiendo igualdad de varianzas poblacionales, se const ruye el est adíst ico de
cont r ast e exper iment al t dado por

,
`

.
|
+

·


·
2 1
2
2 1
2 1
2 1
n
1
n
1
s
x x
) x x ( EE
x x
t
que baj o la hipót esis nula sigue una dist r ibución t - St udent con gr ados de
libert ad gl = ( n
1
- 1) + (n
2
– 1) = (n
1
+ n
2
– 2) .
Para llevar a cabo el cont rast e
H
0
: µ
1
- µ
2
= 0
H
1
: µ
1
- µ
2
≠ 0
suponiendo no igualdad de varianzas poblacionales, se const ruye el est adíst ico
de cont r ast e exper iment al t dado por
2
2
2
1
2
1
2 1
2 1
2 1
n
s
n
s
x x
) x x ( EE
x x
t
+

·


·
Manual G- St at 2. 0 127
que baj o la hipót esis nula sigue una dist r ibución t - St udent con gr ados de
liber t ad gl de Sat t er t hwait e.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la Variable
explicat iva dicot ómica que for ma los dos gr upos. En los dos gr upos, la
var iable r espuest a debe t ener desviación t ípica mayor que cer o.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Caj as: Gráfico de dos Caj as de la variable respuest a para los dos
valor es de la var iable explicat iva. Ver menú Gr áficos.
t - St udent : Se present a el int ervalo de confianza del parámet ro
difer encia poblacional de dos medias y los r esult ados del cont r ast e de
hipót esis de dos medias mediant e la prueba t - St udent .
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
- El programa asume, por defect o, igualdad de varianzas ent re
las var iables, per o puede ser modif icado.
: Est abl ecer si hay di f er enci a de Edad en r el aci ón a l os
Tr at ami ent os.
Result ados de la pr ueba t - St udent asumiendo igualdad de var ianzas.
128
Estimación y Contraste de Dos Medias Poblacionales de EDAD por FARMACO
=========================================================================
Variable Respuesta: EDAD
Variable Explicativa: FARMACO
Grupo 1 2
----------------------------------------------
Tamaños Muestrales 20 20
Medias: 22.6000 22.2300
Desviaciones Típicas: 1.6588 1.1921
E. E. de las Medias: 0.3709 0.2666
----------------------------------------------
Varianza Conjunta: 2.0864
E. E. de la Diferencia de Medias: 0.4568
Grados de Libertad: 38.0000
Diferencia de Medias 0.3700
Estimación
----------
I.C. al 95.00% para la diferencia de medias: 0.3700 +/- 0.9247 [-0.5547,
1.2947]
t-Student
---------
Hipótesis Nula: diferencia de medias = 0.0000
Hipótesis Alternativa: no igual
t-Student: 0.8100
p-valor: 0.4230
Dos Gr upos ( b| y) à t - St udent . Par eados
Realiza el int ervalo de confianza del parámet ro media poblacional de la
difer encia de dos var iables par eadas y un cont r ast e de hipót esis de una media
mediant e la prueba t - St udent para dos variables pareadas.
La prueba t - St udent para dat os pareados calcula en primer lugar una nueva
var iable Var dif que es igual a la pr imer a var iable Var 1 menos la segunda
variable Var2. Para realizar el cont rast e
H
0
: media( Vardif) = µ
0
H
1
: media( Vardif) ≠ µ
0
se calcula el est adíst ico de cont r ast e t como
Manual G- St at 2. 0 129
n
s
x
t
0
µ −
·
donde es la media y s la desviación t ípica de la nueva var iable, que sigue una
dist r ibución t - St udent con gl = n - 1 gr ados de liber t ad.
Manej o del programa
Var i abl es: Se i dent i f i ca l a 1ª Variable pareada y la 2ª Variable
pareada, ambas cuant it at ivas y expr esadas en las mismas unidades. El
pr ogr ama oper ar á int er nament e con la dif er encia de las dos var iables.
La var iable difer encia debe t ener desviación t ípica mayor que cer o.
Est adíst i cos: Est adíst icos de la dif er encia de las dos var iables
pareadas. Se det allan en Cuant it at iva ( y) .
Caj as: Gr áfico de Caj as par a la difer encia de las dos var iables
par eadas. Ver menú Gr áficos.
t - St udent . Par eados: Se pr esent a el int er valo de conf ianza del
parámet ro media poblacional de la diferencia de dos variables pareadas
y los result ados del cont rast e de hipót esis de una media mediant e la
pr ueba t - St udent par a dos var iables par eadas.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
130
: Cont r ast ar si l a medi a de FC2 menos FC1 es super i or a 60.
Result ados descr ipt ivos de la pr ueba t - St udent par a dat os par eados.
Estadísticos para la variable FC2-FC1
==========================================================================
-------------------------------------
Estadístico FC2-FC1
-------------------------------------
N 40
Media 61.7500
Mediana 61.0000
Desviación Típica 10.9772
Mínimo 42.0000
Máximo 82.0000
Asimetría Estandarizada -0.0433
Curtosis Estandarizada -1.0885
-------------------------------------
Result ados de la pr ueba t - St udent par a dat os par eados.
Estimación y Contraste de Una Media Poblacional para FC2 menos FC1
========================================================================
Tamaño Muestral: 40
Media: 61.7500
Estimación
----------
I.C. inferior al 95.00% para la media: 61.7500 - 2.9244 [58.8256]
t-Student
---------
Hipótesis Nula: media = 60.0000
Hipótesis Alternativa: mayor que
Estadístico de contraste t: 1.0083
p-valor: 0.1598
Dos Gr upos ( b| y) à F- Snedecor
Realiza el int er valo de confianza del par ámet r o cocient e poblacional de dos
var ianzas y un cont r ast e de hipót esis de dos var ianzas mediant e la pr ueba F-
Snedecor.
La expr esión par a calcular el I C( 1 - α) % par a el cocient e de var ianzas es
Manual G- St at 2. 0 131

,
`

.
|
·

,
`

.
|
σ
σ
α −
α −
gln gld;
gl gln;
; 2 / 1
2
2
2
1
d ; 2 / 1
2
2
2
1
2
2
2
1
F
s
s
;
F
s
s
% 95 I C
siendo
2
2
2
1
s y s las var ianzas muest r ales par a cada gr upo donde F
1- α/ 2; gln; gld
se calcula a par t ir de una F- Snedecor siendo gln los gr ados de liber t ad del
numerador, que se calculan como el t amaño muest ral del grupo con mayor
var ianza muest r al menos uno, y gld los gr ados de liber t ad del denominador
que se calculan como el t amaño muest ral del grupo con menor varianza
muest r al menos uno.
Para llevar a cabo el cont rast e
H
0
: σ
1
- σ
2
= 0
H
1
: σ
1
- σ
2
≠ 0
mediant e la prueba F- Snedecor de comparación de varianzas se const ruye el
est adíst ico de cont rast e experiment al F dado por
{ ¦
{ ¦
2
2
2
1
2
2
2
1
s ; s mín
s ; s máx
F ·
que baj o la hipót esis nula sigue una dist ribución F- Snedecor siendo gln los
grados de libert ad del numerador y gld los grados de libert ad del denominador.
En el caso de no poder rechazar la hipót esis nula ( p- valor > 0. 05) se considera
que las dos varianzas son iguales ( homogéneas) .
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la Variable
explicat iva dicot ómica que for ma los dos gr upos. En los dos gr upos, la
var iable r espuest a debe t ener desviación t ípica mayor que cer o.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Caj as: Gráfico de dos Caj as de la variable respuest a para los dos
valor es de la var iable explicat iva. Ver menú Gr áficos.
132
F- Snedecor : Se pr esent a el int er valo de confianza del par ámet r o
cocient e poblacional de dos varianzas y los result ados del cont rast e de
hipót esis de dos varianzas mediant e la prueba F- Snedecor.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 1, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
: Se desea compr obar si el coci ent e de var i anzas es i gual a 1 par a
l a v ar i abl e r espuest a FC2FC1, con Far maco como v ar i abl e ex pl i cat i v a.
Gráfico de caj as de la opción F- Snedecor.
Manual G- St at 2. 0 133
Result ados de la pr ueba F- Snedecor .
Estimación y Contraste de Dos Varianzas Poblacionales de FC2FC1 por FARMACO
=========================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: FARMACO
Grupo 1 2
-----------------------------------------------
Tamaños Muestrales 20 20
Desviaciones Típicas: 12.4108 9.6206
Varianzas: 154.0289 92.5553
-----------------------------------------------
Cociente de Varianzas: 1.6642
Estimación
----------
I.C. al 95.00% para el cociente de varianzas: [0.6587, 4.2045]
F-Snedecor
----------
Hipótesis Nula: cociente de varianzas= 1.0000
Hipótesis Alternativa: no igual
Estadístico de contraste F: 1.6642
p-valor: 0.2758
Dos Gr upos ( b| y) à t - St udent y F- Snedecor . Dat os
Agr upados
A part ir de los dat os resumidos de t amaño muest ral, media y desviación t ípica
de cada uno de los gr upos, se puede r ealizar , sin el f icher o de dat os, las
opciones Análisis / 2 Grupos ( b| y) / t - St udent y Análisis / 2 Grupos ( b| y) / F-
Snedecor. Los fundament os t eóricos y la formulación son idént icos a los
pr esent ados en las opciones ant er ior es r espect ivas con dat os a par t ir de
f i cher o.
Manej o del programa
Dat os Agr upados:
Los dat os necesar ios son:
- Nombr e Gr upo 1: Nombr e Cat egor ía1.
- Nombr e Gr upo 2: Nombr e Cat egor ía2.
134
- Tamaño Gr upo 1: Valor n1.
- Tamaño Gr upo 2: Valor n2.
- Media Gr upo 1: Valor de media1.
- Media Gr upo 2: Valor de media2.
- Desv. Típica Gr upo 1: Valor de s1.
- Desv. Típica Gr upo 2: Valor de s2.
Los dos t amaños muest r ales t ienen que ser mayor es que cer o. En los
dos grupos la variable respuest a debe t ener desviación t ípica mayor
que cer o.
t - St udent : Se present a el int ervalo de confianza del parámet ro
difer encia poblacional de dos medias y los r esult ados del cont r ast e de
hipót esis de dos medias mediant e la prueba t - St udent .
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 1, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
- El programa asume, por defect o, igualdad de varianzas ent re
las var iables, per o puede ser modif icado.
F- Snedecor : Se present a el int ervalo de confianza del parámet ro
cocient e poblacional de dos varianzas y los result ados del cont rast e de
hipót esis de dos varianzas mediant e la prueba F- Snedecor.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 1, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
Manual G- St at 2. 0 135
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
- En el int er valo de conf ianza, el nivel de conf ianza se t oma del
valor alfa ( nivel de confianza= 100 - α) . El pr ogr ama asigna,
por def ect o, el valor de α= 5%, per o t ambién son habit uales
los valor es α= 1% y α= 10%. Alfa debe ser > 0 y < 100.
Dos Gr upos ( b| y) à Mann- Whi t ney ( Wi l coxon)
Realiza una comparación ent re dos dist ribuciones de dat os mediant e la prueba
de Mann- Whit ney, t ambién conocida como pr ueba de Wilcoxon par a dos
muest r as independient es. Es una pr ueba no par amét r ica.
Se t ienen dos var iables, una de ellas cuant it at iva no nor mal u or dinal,
considerada como variable respuest a ( Rt a) y la ot ra dicot ómica, considerada
como var iable explicat iva ( Exp) . Par a est ablecer si hay difer encias en la
variable respuest a con relación a los grupos formados por la variable
explicat iva se ut iliza la pr ueba U de Mann- Whit ney o la pr ueba W de Wilcoxon.
Dichas pr uebas son equivalent es ent r e sí y en ambas el cont r ast e que se
r ealiza es
H
0
: Las medianas son iguales
H
1
: Las medianas son diferent es ( caso bilat eral)
H
1
: La mediana del gr upo 1 es super ior / inf er ior a la mediana del gr upo 2
( caso unilat eral)
La expr esión par a el cálculo de la U de Mann- Whit ney viene dada por U
XY
o por
U
YX
donde
{ ¦
2 i 1 i XY
y x # U < ·
{ ¦
1 i 2 i YX
x y # U < ·
siendo x
i1
los valor es de la var iable Rt a par a el gr upo 1 de n
1
individuos, y
i2
l os
valor es de la var iable Rt a par a el gr upo 2 de n
2
individuos.
La not aci ón #{ ¦ r epr esent a el númer o de par es que ver ifican la condición
ent re llaves, t eniendo en cuent a que cualquier par con x
i1
= y
i2
suma 0. 5 en el
cálculo de U
XY
y de U
YX
. Así, U
XY
ser ía el númer o de veces que una obser vación
“ x” ( del gr upo 1) pr ecede a una obser vación “ y” ( del gr upo 2) . De for ma
anál oga U
XY
, ser ía el númer o de veces que una obser vación “ y” ( del gr upo 2)
pr ecede a una obser vación “ x” ( del gr upo 1) . El númer o de empat es ent r e
136
valor es “ x” e “ y” se denot a por d
j
, con j = 1, . . , k siendo k el número de valores
dist int os donde se pr oduce el empat e. Se ver ifica que U
XY
+ U
YX
= n
1
n
2
.
Las expresiones para E[U
XY
], E[U
YX
], V[U
XY
] y V[U
YX
] son
[ ] [ ]
2 1 YX XY
n n
2
1
U E U E · ·
[ ] [ ]
( )
( )
]
]
]

∑ − − −

· ·
·
k
1 j
j
3
j
3 2 1
YX XY
d d n n
1 n n
n n
12
1
U V U V
donde n
1
es el t amaño muest r al del gr upo 1, n
2
es el t amaño muest r al del
gr upo 2 y n es el t amaño muest r al t ot al.
El est adíst ico de cont rast e se calcula como
[ ]
[ ]
[ ]
[ ]
YX
YX YX
XY
XY XY
U V
U E U
U V
U E U
z

·

·
que sigue una dist ribución normal N( 0, 1) .
La expr esión par a el cálculo de la W de Wilcoxon viene dada por W
1
o por W
2
con
∑ ·
1 grupo
1
Rangos W
∑ ·
2 grupo
2
Rangos W
donde los rangos se calculan en relación a la muest ra conj unt a y en el caso de
empat es como pr omedios de los ór denes de las obser vaciones empat adas. Se
verifica que W
1
+ W
2
= 0.5 n ( n+ 1) .
Las expresiones para E[W
1
], E[W
2
], V[W
1
] y V[W
2
] son
[ ] ( ) 1 n n
2
1
W E
1 1
+ ·
[ ] ( ) 1 n n
2
1
W E
2 2
+ ·
[ ] [ ]
( )
( )
]
]
]

∑ − − −

· ·
·
k
1 j
j
3
j
3 2 1
2 1
d d n n
1 n n
n n
12
1
W V W V
donde n
1
es el t amaño muest r al del gr upo 1, n
2
es el t amaño muest r al del
gr upo 2 y n es el t amaño muest r al t ot al.
El est adíst ico de cont rast e se calcula como
Manual G- St at 2. 0 137
[ ]
[ ]
[ ]
[ ]
2
2 2
1
1 1
W V
W E W
W V
W E W
z

·

·
que sigue una dist ribución normal N( 0, 1) . Est e programa proporciona un p-
valor asint ót ico par a est a opción.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable r espuest a cuant it at iva u ordinal y la
Variable explicat iva dicot ómica que forma los dos grupos. La variable
r espuest a no puede ser const ant e en los dos gr upos.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Caj as: Gráfico de dos Caj as de la variable respuest a para los dos
valor es de la var iable explicat iva. Ver menú Gr áficos.
Mann- Whi t ney ( Wi l cox on) : Se pr esent an los r esult ados del
cont r ast e de hipót esis ent r e dos dist r ibuciones de dat os mediant e la
prueba de Mann- Whit ney ( Wilcoxon) .
Opciones:
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( referido a la
igualdad de dist ribuciones que cont rast a la hipót esis nula) .
: Compr obar si l a di st r i buci ón de l a v ar i abl e FC2FC1 es di f er ent e
par a f umador es y no f umador es.
Result ados descr ipt ivos de la pr ueba Mann- Whit ney ( Wilcoxon) .
Estadísticos para la variable FC2FC1 por FUMADOR
===========================================================================
-----------------------------------------
Grupos 1 2
-----------------------------------------
N 16 24
Media 64.3125 60.0417
Mediana 67.0000 59.5000
138
Desviación Típica 10.9527 10.8847
Mínimo 42.0000 42.0000
Máximo 82.0000 82.0000
Cuartil Inferior 56.0000 52.0000
Cuartil Superior 72.0000 68.0000
-----------------------------------------
Gráfico de caj as de la opción Mann- Whit ney ( Wilcoxon)
Result ados de la prueba Mann- Whit ney ( Wilcoxon) .
Mann-Whitney (Wilcoxon) de FC2FC1 por FUMADOR
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: FUMADOR
Grupo 2 1
--------------------------------------------
Tamaños Muestrales 24 16
Medianas: 59.50 67.00
Rangos Medios: 18.6042 23.3438
--------------------------------------------
Estadístico de Mann-Whitney
---------------------------
Hipótesis Nula: igualdad de distribuciones
Hipótesis Alternativa: distribución 2 no igual distribución 1
Uxy = 237.5000; E[Uxy] = 192.0000; V[Uxy] = 1308.8000
Manual G- St at 2. 0 139
Uyx = 146.5000; E[Uyx] = 192.0000; V[Uyx] = 1308.8000
Estadístico de contraste de U: -1.2577
p-valor de U: 0.2085
Estadístico W de Wilcoxon
-------------------------
Hipótesis Nula: igualdad de distribuciones
Hipótesis Alternativa: distribución 2 no igual distribución 1
W1 = 446.5000; E[W1] = 492.0000; V[W1] = 1308.8000
W2 = 373.5000; E[W2] = 328.0000; V[W2] = 1308.8000
Estadístico de contraste de W: -1.2577
p-valor de W: 0.2085
Dos Gr upos ( b| y) à Wi l coxon. Par eados
Realiza un cont r ast e de hipót esis de la mediana de la dist r ibución de la var iable
dif er encia mediant e la pr ueba de Wilcoxon par a dat os par eados. Es una pr ueba
no par amét r ica.
La pr ueba de Wilcoxon par a dat os par eados ( o pr ueba de Rangos signados par a
dat os par eados) calcula en pr imer lugar una nueva var iable Var dif que es igual
a la pr imer a var iable Var 1 menos la segunda var iable Var 2. Par a r ealizar el
cont rast e
H
0
: med( Vardif) = med
0
H
1
: med( Vardif) ≠ med
0
se aplica a est a nueva var iable la pr ueba de los Rangos signados par a una
muest r a.
Se t iene, por t ant o , que la pr ueba de Wilcoxon par a dat os par eados se basa en
cont ar , par a la var iable difer encia, los valor es que est án por encima y por
debaj o del valor supuest o par a la mediana, t eniendo en cuent a las magnit udes
además del signo.
El est adíst ico de cont rast e sigue una dist ribución Normal ( 0, 1) . Est e programa
pr opor ciona un p- valor asint ót ico par a est a opción.
Manej o del programa
140
Var i abl es: Se i dent i f i ca l a 1ª Variable pareada y la 2ª Variable
pareada, ambas cuant it at ivas u or dinales y expr esadas en las mismas
unidades. El programa operará int ernament e con la diferencia de las
dos var iables. La var iable difer encia no puede ser const ant e con el
valor de la mediana de cont r ast e igual a la mediana de la muest r a.
Est adíst i cos: Est adíst icos de la dif er encia de las dos var iables
pareadas. Se det allan en Cuant it at iva ( y) .
Caj as: Gr áfico de Caj as par a la difer encia de las dos var iables
par eadas. Ver menú Gr áficos.
Wi l cox on. Par eados: Se present an los result ados del cont rast e de
hipót esis de la mediana de la dist ribución de la variable diferencia
mediant e la pr ueba de Wilcoxon par a dat os par eados.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
: Real i zar l a pr ueba de Wíl cox on par a obser var si l a medi ana de l a
di f er enci a de FC2 menos FC1 es super i or a 60.
Result ados de la pr ueba de Wilcoxon par a dat os par eados.
Wilcoxon para la Mediana Poblacional de FC2 menos FC1
======================================================================
Tamaño Muestral: 40
Mediana: 61.0000
Wilcoxon. Pareados
------------------
Hipótesis Nula: mediana = 60.0000
Hipótesis Alternativa: mayor que
Manual G- St at 2. 0 141
Rango medio de valores por debajo del valor a contrastar de la mediana:
20.8000
Rango medio de valores por encima del valor a contrastar de la mediana:
16.8824
Estadístico de contraste: -0.9741 (con corrección de continuidad)
p-valor: 0.1650
Dos Gr upos ( b| y) à Si gnos. Par eados
Realiza un cont r ast e de hipót esis de la mediana de la dist r ibución de la var iable
diferencia mediant e la prueba de los Signos para dat os pareados. Es una
pr ueba no par amét r ica.
La pr ueba de los Signos par a dat os par eados calcula en pr imer lugar una nueva
var iable Var _dif que es igual a la pr imer a var iable Var 1 menos la segunda
var iable Var 2. Par a r ealizar el cont r ast e:
H
0
: med( Var_dif) = med
0
H
1
: med( Var_dif) ≠ med
0
se aplica a est a nueva var iable la pr ueba de los Signos par a una muest r a. En el
caso de dat os dicot ómicos par eados, la pr ueba de los Signos y la de McNemar
son equivalent es.
Se t iene, por t ant o , que la pr ueba de Signos par a dat os par eados se basa en
cont ar , par a la var iable difer encia, los valor es que est án por encima y por
debaj o del valor supuest o par a la mediana, sin t ener en cuent a las magnit udes,
sól o el si gno.
El est adíst ico de cont rast e sigue una dist ribución Normal ( 0, 1) . Est e programa
pr opor ciona un p- valor asint ót ico par a est a opción.
Manej o del programa
Var i abl es: Se i dent i f i ca l a 1ª Variable pareada y la 2ª Variable
pareada, ambas cuant it at ivas u or dinales y expr esadas en las mismas
unidades. El programa operará int ernament e con la diferencia de las
dos var iables. La var iable difer encia no puede ser const ant e con el
valor de la mediana de cont r ast e igual a la mediana de la muest r a.
142
Est adíst i cos: Est adíst icos de la dif er encia de las dos var iables
pareadas. Se det allan en Cuant it at iva ( y) .
Caj as: Gr áfico de Caj as par a la difer encia de las dos var iables
par eadas. Ver menú Gr áficos.
Si gnos. Par eados: Se present an los result ados del cont rast e de
hipót esis de la mediana de la dist ribución de la variable diferencia
mediant e la pr ueba de Signos par a dat os par eados.
Opciones:
- El valor que se quier e cont r ast ar en la Hipót esis Nula. El
pr ogr ama asigna, por defect o, el valor 0, que es el más
habit ual, per o puede modificar se.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( r ef er i do al val or
que cont r ast a la hipót esis nula) .
Dos Gr upos ( b| y cens)
Abr e un submenú con una t écnica est adíst ica par a una var iable explicat iva
dicot ómica o binaria ( b) que int ent a explicar una variable respuest a
cuant it at iva con dat os censurados por la derecha ( y cens) . Se incluye la prueba
Log- Rank.
Dos Gr upos ( b| y cens) à Log- Rank
Realiza una comparación ent re dos curvas de supervivencia, donde la
super vivencia r epr esent a la pr obabilidad de sobr evivir a un t iempo dado,
mediant e la prueba Log- Rank.
Para realizar la prueba Log- Rank, se ordenan de forma crecient e los k dist int os
valores exact os ( no censurados) de la variable respuest a ( “ t iempo hast a” ) ,
denot ando est os t iempos por
k 2 1
t ... t t < < <
En cada uno de est os t iempos se const r uye una t abla 2x2 con
Manual G- St at 2. 0 143
Gr upo 1 Gr upo 2 Tot al
Muert es d
1j
d
2j
d
j
Supervivient es n
1j
-d
1j
n
2j
-d
2j
n
j
-d
j
En riesgo n
1j
n
2j
n
j
siendo d
1j
el númer o de individuos del gr upo 1 con dat o exact o igual a t
j
, d
2j
el
númer o de i ndi vi duos del gr upo 2 con dat o exact o i gual a t
j
, d
j
= d
1j
+ d
2j
. Los
individuos a r iesgo n
1j
del gr upo 1 son aquellos que t ienen dat o exact o mayor o
igual que t
j
, análogament e con los individuos en riesgo del grupo 2, n
j
=n
1j
+n
2j
.
A par t ir de las k t ablas 2x2 ant er ior es se const r uye el est adíst ico de cont r ast e z
( )
( )



,
`

.
|

·
·
·
k
1 j
j
2
j
j j j j 2 j 1
k
1 j
j
j
j 1 j 1
1 n n
d n d n n
n
d
n d
z
que sigue una dist ribución Normal o el est adíst ico Chi- 2
( )
( )


,
`

.
|

,
`

.
|

· χ
·
·
k
1 j
j
2
j
j j j j 2 j 1
2
k
1 j
j
j
j 1 j 1
2
1 n n
d n d n n
n
d
n d
que sigue una dist r ibución Chi- Cuadr ado con 1 gr ado de liber t ad.
Manej o del pr ogr ama
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva j unt o con la
var iable dicot ómica que cont iene el código de dat o censur ado y la
Variable explicat iva dicot ómica que f or ma los gr upos. El código
asociado al dat o censurado de la variable censura puede cambiarse en
las opciones de las pant allas de r esult ados.
Est adíst i cos: Est adíst icos de la var iable r espuest a y de la var iable
explicat iva est rat ificados por la variable censura. Se det allan en
Cuant it at iva ( y) . Los est adíst icos a calcular se def inen en las opciones.
144
Kapl an- Mei er Tabl a: Dat os de la curva de supervivencia de t odos los
casos y , alt er nat ivament e, las de los gr upos for mados por la var iable
explicat iva.
Opciones:
- El código asociado a los dat os censur ados.
- Est r at ificación por la var iable explicat iva.
Kapl an- Mei er Gr áf i co: Gr áfico con la cur va de super vivencia de t odos
los casos y , alt er nat ivament e, las de los gr upos for mados por la
var iable explicat iva.
Opciones:
- El código asociado a los dat os censur ados.
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e incr ement o de los ej es X e Y.
- Est r at ificación por la var iable explicat iva.
Log- Rank : Se pr esent an los r esult ados del cont r ast e de hipót esis ent r e
dos cur vas de super vivencia mediant e la pr ueba Log- Rank.
Opciones:
- El código asociado a los dat os censur ados.
- El t ipo de apr oximación deseada en la Hipót esis Alt er nat iva. El
pr ogr ama asigna, por defect o, la opción ‘no igual’, que puede
modificarse por ‘mayor que’ o ‘menor que’ ( referido a la
igualdad de cur vas de super vivencia que cont r ast a la hipót esis
nula) .
x | y
Abre un submenú con diferent es t écnicas est adíst icas para una variable
explicat iva cuant it at iva ( x) que int ent a explicar una var iable cuant it at iva ( y) y
t écnicas de asociación par a dos var iables cuant it at ivas. Son, por t ant o, t écnicas
de regresión y correlación. Se incluyen las siguient es t écnicas: Regresión Lineal
Simple, Modelos Transformados y Regresión Polinómica.
Manual G- St at 2. 0 145
x | y à Regr esi ón Li neal Si mpl e
Realiza el análisis de regresión lineal simple, proporcionando,
fundament alment e, los coeficient es de la regresión y su significación. De forma
adicional se calculan los coeficient es de cor r elación de Pear son, Spear man e
int r aclase.
El cálculo de los coef icient es b
0
y b
1
se r ealiza mediant e el mét odo de los
mínimos cuadrados. La significación est adíst ica de los coeficient es del modelo
se calcula a par t ir del coeficient e y de su er r or est ándar , de for ma que par a b
0
( )
( )
0
0
0
b EE
b
b t ·
sigue una dist ribución t - St udent con n - 2 grados de libert ad y para b
1
( )
( )
1
1
1
b EE
b
b t ·
sigue una dist r ibución t - St udent con n – 2 gr ados de liber t ad.
Para realizar el cont rast e
H
0
: ρ = 0
H
1
: ρ ≠ 0
a t r avés del coeficient e de cor r elación de Pear son, se const r uye el siguient e
est adíst ico de cont rast e
2
r 1
2 n
r t


·
que sigue una dist r ibución t - St udent con n – 2 gr ados de liber t ad. La
significación del coeficient e de correlación de Pearson coincide con la
significación de la pendient e de la ecuación de la r ect a de r egr esión.
Para realizar el cont rast e
H
0
: ρ = 0
H
1
: ρ ≠ 0
a t ravés del coeficient e de correlación de Spearman se const ruye el siguient e
est adíst ico de cont rast e
2
s
s
r 1
2 n
r t


·
146
que sigue una dist r ibución t - St udent con n - 2 gr ados de liber t ad.
Adicionalment e, el programa muest ra el coeficient e de correlación int raclase
CCI y su significación. Dicho coeficient e se calcula cr eando una disposición de
dat os int ermedia de la forma
1 1 y
1
1 2 x
1
2 1 y
2
2 2 x
2


n 1 y
n
n 2 x
n
y ut ilizando la t écnica Anova un fact or con bloques ( ver más adelant e en el
manual en la opción Anova / Anova un fact or con bloques) , que pr opor ciona el
CMB ( cuadrado medio ent re bloques) , el CMG ( cuadrado medio ent re grupos) ,
el CMR ( cuadr ado medio r esidual) y el valor F de los bloques. A par t ir de est os
valores se calcula
( )
( )CMR 2 n n 2 CMG 2 nCMB
CMR CMB n
CCI
− − + +

·
La signif icación del CCI viene dada por la signif icación del valor F de los
bl oques.
Cuando la var iable que se int ent a explicar muest r a inest abilidad en la var ianza
( los valores grandes t ienen mayor varianza que los valores pequeños) y se
desconoce su dist r ibución, es posible aplicar la t r ansfor mación de Box- Cox,
mét odo diseñado par a hallar la mej or t r ansfor mación de la var iable r espuest a.
Las t r ansfor maciones más fr ecuent es son:
Model o Ex pr esi ón
Exponenci al ( ) x b b exp y
1 0
+ ·
Recíproco- y
x b b
1
y
1 0
+
·
Recíproco- x
x
1
b b y
1 0
+ ·
Manual G- St at 2. 0 147
Recíproca- doble
x
1
b b
y
1
1 0
+ ·
Logarit mo- x ( ) x Ln b b y
1 0
+ ·
Mult iplicat ivo
1
b
0
x b y ·
Raíz cuadrada- x x b b y
1 0
+ ·
Raíz cuadrada- y x b b y
1 0
+ ·
Cur va en S

,
`

.
|
+ ·
x
1
b b exp y
1 0
Todas ellas t ienen una expresión analizable mediant e un modelo de regresión
simple ut ilizando las variables t ransformadas. De t odas las posibles
t ransformaciones es habit ual escoger como la más adecuada, aquella que
pr esent a un coef icient e de det er minación R
2
mayor , o bien en f unción de la
r epr esent ación gr áfica de las var iables.
Puede que, a pesar de hacer las t r ansfor maciones ant er ior es no se consiga
linealidad en la nube de punt os. En est os casos, se puede recurrir a modelos de
r egr esión polinómica que son un caso par t icular de la r egr esión mult ivar iant e,
per o donde sólo se ut iliza la var iable explicat iva or iginal y pot encias de ést a. En
los modelos de r egr esión polinómica, de for ma análoga a la r egr esión lineal
simple, exist en coeficient es del modelo, significaciones de ést os y coeficient e
R
2
del model o.
Rect a de aj ust e
En el gr áf ico se muest r a la r ect a de r egr esión est imada por mínimos
cuadr ados. Además se muest r a el huso de pr edicciones que const a de unas
cur vas int er ior es al 95% de pr edicción par a valor es medios ( color r oj o) y de
unas cur vas ext er ior es al 95% de pr edicción de valor es individuales ( color
azul) .
Las líneas de predicción para valores medios ( roj as) del gráfico se calculan
como
( )
( ) ∑ −

+ ⋅ t +
·
− −
n
1 i
2
i
2
i
e 2 n , 2 / 05 . 0 1 i 1 0
x x
x x
n
1
s t x b b
148
Las líneas de predicción de valores individuales ( azules) del gráfico se calculan
como
( )
( ) ∑ −

+ + ⋅ t +
·
− −
n
1 i
2
i
2
i
e 2 n , 2 / 05 . 0 1 i 1 0
x x
x x
n
1
1 s t x b b
Los val or es x
i
no se limit an a los valor es obser vados en la muest r a, sino a
cualquier valor compr endido en el r ango exper iment al.
Anova en l a r egr esi ón
La t abla Anova del modelo per mit e est ablecer la significación global del
modelo. Para su cálculo int ervienen dist int os est adíst icos: suma de cuadrados
del modelo ( SCM) , suma de cuadr ados t ot al ( SCT) , suma de cuadr ados r esidual
( SCR) , grados de libert ad del modelo ( GLM) , grados de libert ad t ot al ( GLT) ,
grados de libert ad residual ( GLR) , cuadrado medio del modelo ( CMM) y
cuadrado medio residual ( CMR) , donde
( )( )
( )
n
x
x
n
y x
y x
SCM
2
i 2
i
2
i i
i i

− ∑
]
]
]


∑ ∑

·
( )
]
]
]
]


− ∑ ·
n
y
y SCT
2
i 2
i
SCM SCT SCR − ·
1 GLM · , 1 n GLT − · , GLM GLT GLR − ·
GLM
SCM
CMM · ,
GLR
SCR
CMR ·
Por últ imo, la significación del modelo viene dada por
CMR
CMM
F ·
que sigue una dist r ibución F- Snedecor con GLM = 1 gr ados de liber t ad del
numer ador y GLR = n – 2 gr ados de liber t ad del denominador .
Si se calcula el cocient e ent r e SCM y SCT se obt iene el coeficient e de
det er minación, que si se expr esa en t ant o por cient o r epr esent a el por cent aj e
Manual G- St at 2. 0 149
de infor mación que explica el modelo. El coeficient e de det er minación t ambién
se puede calcular como el cuadr ado del coeficient e de cor r elación de Pear son.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la Variable
explicat iva cuant it at iva.
Est adíst i cos: Est adíst icos univariant es de la variable respuest a y de la
variable explicat iva. Se det allan en Cuant it at iva ( y) .
Rect a de Aj ust e : Gr áf ico con la r ect a de r egr esión est imada por
mínimos cuadr ados. Además, se muest r a el huso de pr edicciones que
const a de unas curvas int eriores al 95% de predicción para valores
medios ( color r oj o) y de unas cur vas ext er ior es al 95% de pr edicción
de valores individuales ( color azul) . Posicionando el cursor sobre
cualquier punt o se obt ienen las coor denadas.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e incr ement o de los ej es X e Y.
Model o: Result ados de la regresión lineal simple. Coeficient es de la
regresión, errores est ándar, significación de los coeficient es, desviación
t ípica de los residuos. Correlación de Pearson. Correlación de Spearman
con su significación. Coeficient e de correlación int raclase y significación.
Opciones:
- El t ipo de modelo que se desea aj ust ar: Lineal, Exponencial,
Recíproco- y, Recíproco- x, Recíproca Doble, Logarit mo- x,
Mult iplicat ivo, Raíz Cuadrada- x, Raíz Cuadrada- y, Curva en S.
Anova: Significación de la r egr esión lineal mediant e el análisis de la
varianza. La significación del modelo coincide con la pendient e o
coeficient e de r egr esión b1.
150
: Est abl ecer si l a var i abl e FC1 est á r el aci onada o ex pl i ca
si gni f i cat i v ament e l a v ar i abl e FC2.
Est adíst icos de la opción r egr esión lineal simple.
Regresión Lineal Simple. Estadísticos
====================================================================
Variable Respuesta: FC2
Variable Explicativa: FC1
Número de Casos: 40
--------------------------------------------------
Variable FC1 FC2
--------------------------------------------------
N 40.0 40.0
Media 75.9500 137.7000
Mediana 74.0000 137.0000
Moda 68.0000 126.0000
Media Geométrica 75.3846 137.0738
Varianza 90.9718 176.3692
Desviación Típica 9.5379 13.2804
E.E. de la Media (*) 1.5081 2.0998
Mínimo 62.0000 112.0000
Máximo 96.0000 165.0000
Rango 34.0000 53.0000
Cuartil Inferior 68.0000 127.0000
Cuartil Superior 83.0000 147.0000
Rango Intercuartílico 15.0000 20.0000
Asimetría 0.5493 0.0850
Asimetría Estandarizada 1.4184 0.2196
Curtosis -0.7245 -0.6570
Curtosis Estandarizada -0.9353 -0.8482
Coeficiente de Variación 12.5581 9.6445
--------------------------------------------------
(*) Usar con propósito de estimación para el I.C. de la media
Result ados de la r egr esión lineal simple.
Modelo de FC2 con FC1
======================================================================
Número de Casos: 40
Modelo: Lineal
----------------------------------------------------------------
Ecuación: FC2 = 76.4031 + 0.8071 * FC1
----------------------------------------------------------------
Coef. E.E. t-valor p-valor
Manual G- St at 2. 0 151
----------------------------------------------------------------
Ordenada 76.4031 14.0864 5.4239 0.0001
Pendiente 0.8071 0.1841 4.3848 0.0001
----------------------------------------------------------------
r de Pearson (coeficiente de correlación) 0.5796
r cuadrado (coeficiente de determinación) 33.60%
Desviación Típica de los Residuos 10.9634
Rho de Spearman 0.5567 t-valor 4.1311 p-valor 0.0002
Significación mediant e la pr ueba Anova.
Regresión Lineal Simple. Análisis de la Varianza
======================================================================
Variable Respuesta: FC2
Variable Explicativa: FC1
Número de Casos: 40
Anova
Modelo: Lineal
Suma de Cuadrado
Variabilidad Cuadrados G.L. Medio F-valor p-valor
-------------------------------------------------------------------------
Modelo 2310.9613 1 2310.9613 19.2266 0.0009E-1
Residual 4567.4387 38 120.1958
-------------------------------------------------------------------------
Falta de ajuste 2211.3054 15 147.4204 1.4391 0.2101
Error 2356.1333 23 102.4406
-------------------------------------------------------------------------
Total 6878.4000 39
x | y à Model os Tr ansf or mados
Calcula el coeficient e de det er minación, R cuadr ado, par a dist int os modelos de
r egr esión simple.
El coeficient e de det er minación se calcula como el cocient e ent r e la suma de
cuadr ados explicada y la suma de cuadr ados t ot al, por lo que cuant ifica la
pr opor ción de var iabilidad de la var iable r espuest a que es explicada por la
var iable explicat iva, o dicho de ot r a for ma, el por cent aj e de infor mación
compar t ida. El coeficient e de det er minación se encuent r a ent r e 0 y 1 ( ó ent r e 0
y 100 si se expr esa en t ant o por cient o) . El mej or modelo es el de mayor R
cuadr ado.
Los modelos disponibles se encuent r an descr it os en Análisis / x| y / Regr esión
Lineal Simple.
152
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la Variable
explicat iva cuant it at iva.
Model os: Muest ra los result ados del coeficient e de det erminación para
los diferent es modelos const ruidos. Los modelos son: Lineal,
Exponencial, Recíproco- y, Recíproco- x, Recíproca Doble, Logarit mo- x,
Mult iplicat ivo, Raíz Cuadrada- x, Raíz Cuadrada- y, Curva en S.
: Est abl ecer l os coef i ci ent es de det er mi naci ón de t odos l os posi bl es
model os de r egr esi ón ent r e l as v ar i abl es FC2 y FC1.
Coef icient es de det er minación de modelos t r ansf or mados.
Comparación de Modelos Transformados de Y = FC1 con X = FC2
======================================================================
Número de Casos: 40
Modelo r-cuadrado(%)
----------------------------------
Lineal 33.5974
Exponencial 33.3378
Recíproco-Y 32.8187
Recíproco-X 31.7372
Recíproca Doble 31.1088
Multiplicativo 32.5389
Raiz Cuadrada-X 33.1994
Raiz Cuadrada-Y 33.5000
Curva en S 31.5561
----------------------------------
x | y à Regr esi ón Pol i nómi ca
Realiza un análisis de regresión polinómica para modelos bivariant es
cuadr át icos y cúbicos.
En la r egr esión polinómica se cont empla como posibles var iables explicat ivas a
la variable x y a pot encias de ést a. Es, por t ant o, un caso part icular de la
Regresión Lineal Múlt iple. Ver fórmulas en Mult ivariant e / Regresión Múlt iple.
Se cont emplan aj ust es polinómicos de gr ado 2 ó 3 según se especifique. Si la
significación del coeficient e de mayor orden es < 0. 05 se t iene que el modelo
con dicho t érmino es mej or que sin él. El coeficient e de det erminación R2
Manual G- St at 2. 0 153
r eflej a el por cent aj e de var iabilidad explicada por el modelo. El est adíst ico de
Dur bin- Wat son se usa par a est udiar la aut ocor r elación en los r esiduos.
La t abla Anova del modelo per mit e est ablecer la significación global del
modelo. Para su cálculo int ervienen dist int os est adíst icos: suma de cuadrados
del modelo ( SCM) , suma de cuadr ados t ot al ( SCT) , suma de cuadr ados r esidual
( SCR) , grados de libert ad del modelo ( GLM) , grados de libert ad t ot al ( GLT) ,
grados de libert ad residual ( GLR) , cuadrado medio del modelo ( CMM) y
cuadrado medio residual ( CMR) . Ver fórmulas en Mult ivariant e / Regresión
Múl t i pl e.
La significación del modelo viene dada por F que se calcula como el cocient e
ent r e CMM y CMR,
que sigue una dist r ibución F- Snedecor con GLM = p ( con p el or den del
polinomio) gr ados de liber t ad del numer ador y GLR = n – 1 – p gr ados de
liber t ad del denominador .
Si se calcula el cocient e ent r e SCM y SCT se obt iene el coeficient e de
det er minación, que si se expr esa en t ant o por cient o, r epr esent a el por cent aj e
de infor mación que explica el modelo.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la Variable
explicat iva cuant it at iva.
Est adíst i cos: Est adíst icos univariant es de la variable respuest a y de la
variable explicat iva. Se det allan en Cuant it at iva ( y) .
Model o: Result ados de la regresión polinómica. Coeficient es de la
regresión, errores est ándar, significación de los coeficient es, desviación
t ípica de los r esiduos.
Opciones: Or den del polinomio: 2 ó 3.
Anova: Result ados de la signif icación de los modelos mediant e el
análisis de la var ianza.
154
Or den del Pol i nomi o: Se facilit a una descr ipción de dist int os modelos
polinómicos con dist int o grado, ya que pudiera ocurrir que un modelo
polinómico de mayor grado no mej orara est adíst icament e un modelo
polinómico con grado inferior.
Opciones: Or den del polinomio: 2 ó 3.
: Compar ar l os model os pol i nómi cos de r egr esi ón que pueden
conf or mar se con l a v ar i abl e Edad como v ar i abl e ex pl i cat i v a y l a
v ar i abl e FC2FC1 como v ar i abl e r espuest a.
Result ados de la r egr esión polinómica de or den 2 en la pest aña Modelo.
Regresión Polinómica. Modelo
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: EDAD
Número de Casos: 40
Modelo Polinomial de orden 2
--------------------------------------------------------
Coef. E.E. t-valor p-valor
--------------------------------------------------------
Ordenada 289.7652 118.0072 2.4555 0.0189
EDAD -13.1653 10.4859 -1.2555 0.2172
EDAD^2 0.1330 0.2324 0.5723 0.5706
--------------------------------------------------------
r cuadrado (coeficiente de determinación) 88.3239
r cuadrado (ajustado) 87.6928%
Desviación Típica de los Residuos 3.8510
Error Absoluto Medio 2.8737
Durbin-Watson 1.5419
Compar ación de modelos polinómicos con la pest aña Or den de polinomio.
Regresión Polinómica. Orden del Polinomio
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: EDAD
Número de Casos: 40
ANOVA para Modelos con distinto orden de polinomio ajustado.
----------------------------------------------------------------------
Manual G- St at 2. 0 155
Suma de Cuadrado
Fuente Cuadrados G.L. Medio F-valor p-valor r cuadrado
--------------------------------------------------------------------
EDAD 4145.9258 1 4145.9258 283.8489 0.0001E-14 88.2206
EDAD^2 4.8565 1 4.8565 0.3325 0.5678 88.3239
EDAD^3 22.8982 1 22.8982 1.5677 0.2186 88.8112
--------------------------------------------------------------------
Modelo 4173.6805
El modelo no mej ora significat ivament e con la ut ilización de polinomios de
gr ado 2 ó 3.
156
Manual G- St at 2. 0 157
Menú Anova
Act ivar la opción Anov a del menú pr incipal o mediant e Alt + O. Est e menú
cont iene las opciones necesar ias par a r ealizar las difer ent es pr uebas Anova.
Anova Un Fact or ( a| y)
Realiza la pr ueba Anova un fact or . Asimismo, facilit a, ent r e ot r as t écnicas
asociadas a ella, las compar aciones múlt iples a post er ior i.
El Análisis de la Varianza ( Anova: “ Analysis of Variance” ) permit e comparar las
medias de r grupos, siendo r mayor o igual a 2. El modelo Anova presupone
que las var ianzas de los gr upos son iguales y que los r esiduos o er r or es son
aleat or ios, independient es e idént icament e dist r ibuidos siguiendo una ley
nor mal con media 0 y desviación const ant e. La hipót esis nula de la pr ueba
Anova de un f act or es:
H
0
: Las medias de los k gr upos son t odas iguales
H
1
: Al menos una de las medias es diferent e
Est a pr ueba se basa en la compar ación de las sumas de cuadr ados medias,
debidas a la variabilidad ent re grupos y la debida a la variabilidad int ra grupos
( dent r o de los gr upos) . Ambas sumas son est imaciones independient es de la
variabilidad global, de manera que, si el cocient e ent re la primera y la segunda
es grande, se t endrá mayor probabilidad de rechazar la hipót esis nula. Est e
cocient e sigue una dist r ibución F con r - 1 y n - r gr ados de liber t ad. La
hipót esis nula de igualdad de medias se r echaza en el caso en el que p-
valor < 0. 05, en caso cont r ar io no hay evidencia suficient e par a poder
rechazarla. En el caso de que se rechace la hipót esis nula de igualdad de
158
medias se puede det er minar mediant e compar aciones múlt iples a post er ior i, de
qué gr upo o gr upos pr ovienen esas difer encias.
Las sumas de cuadr ados son un paso pr evio par a el cálculo del Anova. La suma
de cuadr ados ent r e gr upos SCE, la suma de cuadr ados dent r o de gr upos SDE y
la suma de cuadr ados t ot al SCT se calculan del siguient e modo:
( ) ∑ − ·
·
r
1 j
2
. . j .
j
x x n SCE
( ) ∑ ∑ − ∑ · ∑ ∑ − ·
· · · · ·
r
1 j
r
1 j
2
j .
j
n
1 i
2
ij
r
1 j
n
1 i
2
j .
ij
x n x x x SCD
j j
( ) ∑ ∑ − ·
· ·
r
1 j
n
1 i
2
. .
ij
j
x x SCT
donde se denot a por r al númer o de gr upos, por n
j
el númer o de individuos en
cada grupo j = 1, …, r, j . x la media de cada gr upo y .. x la media global.
Ut ilizando la siguient e igualdad que per mit e expr esar las desviaciones ent r e los
dat os obser vados x
ij
y la media t ot al ( “ grand mean” ) .. x como suma de las
desviaciones de la media del grupo j . x y la media t ot al más las desviaciones
ent re los dat os observados y la media del grupo, de forma que
( ) ( ) j .
ij
. . j . . .
ij
x x x x x x − + − · −
se puede demost rar que SCT = SCE + SCD y, por t ant o, la variabilidad de los
dat os ( dada por SCT) se expr esa como la suma de la var iabilidad explicada
debida a los grupos ( a las medias) dada por SCE más la variabilidad dent ro de
los grupos ( variabilidad residual o variabilidad no explicada) dada por SCD.
Los gr ados de liber t ad ent r e gr upos GLE, dent r o de los gr upos GLD y t ot al GLT
son
GLE = r - 1 , GLD = n - r , GLT = n - 1
El cuadr ado medio ent r e gr upos CME y el cuadr ado medio dent r o de gr upos son
GLE
SCE
CME · ,
GLD
SCD
CMD ·
El est adíst ico de cont rast e para realizar la prueba Anova se const ruye con
CMD
CME
F ·
Manual G- St at 2. 0 159
que se dist r ibuye según una F- Snedecor con GLE gr ados de liber t ad del
numerador y GLD grados de libert ad del denominador.
Una medida r elat iva de la var iabilidad explicada por los gr upos es el cocient e
SCT
SCE
R
2
·
que se denomina coeficient e de det erminación; est e coeficient e est ará ent re
cer o y uno. Queda clar o que cuant o más pr óximo est é de 1, más var iabilidad
explica el modelo, y, por t ant o, menos var iabilidad no explicada o r esidual.
La inf or mación ant er ior se suele disponer en f or ma de t abla:
Suma
de Cuadr ados
G. L. Cuadr ado
Medio
F- val or p- val or
Ent re Grupos SCE GLE CME F p
Dent ro Grupos SCD GLD CMD
Tot al SCT GLT
Medi as e I C
Se muest r an par a cada uno de los gr upos, las medias de la var iable
cuant it at iva, j unt o con su error est ándar y sus int ervalos de confianza
calculados según dist int os mét odos. Est os int er valos de confianza se pueden
r epr esent ar gr áficament e con la pest aña “ Gr áfico de Medias” .
Exist en las siguient es opciones:
- Ninguno: no se muest ra ningún int ervalo.
- Er r or es Est ándar ( agr upado) : int er valos dados por la media + / - er r or
est ándar basado en la var ianza conj unt a ( pooled) . En est a opción el er r or
est ándar par a la media de cada gr upo i y los límit es del int er valo vienen
dados por
j
n
CMD
,
j
j
n
CMD
x t
- Er r or es Est ándar ( individual) : int er valos dados por la media + / - er r or
est ándar basado en cada una de las var ianzas individuales. En est a opción
el er r or est ándar par a la media de cada gr upo j y los límit es del int er valo
vi enen dados por
160
j
2
j
n
s
,
j
2
j
j
n
s
x t
- I nt er valos de Confianza ( agr upado) : int er valos de confianza par a cada
media basados en la var ianza conj unt a. En est a opción el er r or est ándar
par a la media de cada gr upo j y los límit es del int er valo vienen dados por
j
n
CMD
,
j
r n ; 2 / 1
j
n
CMD
t x
− α −
t
- I nt ervalos de Confianza ( individual) : int ervalos de confianza para cada
media basados en la var ianza individual. En est a opción el er r or est ándar
par a la media de cada gr upo j y los límit es del int er valo vienen dados por
j
2
j
n
s
,
j
2
j
1 n ; 2 / 1
j
n
s
t x
j
− α −
t
- I nt ervalos LSD: int ervalos basados en el mét odo de Fisher de mínima
diferencia significat iva ( least significant difference = LSD) , donde se
comparan cualquier par de medias con una confianza prefij ada. En est a
opción el er r or est ándar par a la media de cada gr upo j y los límit es del
int er valo vienen dados por
j
n
CMD
,
j
r n ; 1 ; 1
j
n
CMD
F x
− α −
t
- I nt er valos HSD de Tukey: int er valos basados en el mét odo de Tukey de
diferencia “ honradament e” significat iva ( honest ly significant difference =
HSD) , donde se compar an cada par de medias con una confianza pr efij ada.
Si se denot a por q a la función “ rango est udent izado inversa” , en est a
opción el er r or est ándar par a la media de cada gr upo j y los límit es del
int er valo vienen dados por
j
n
CMD
,
j
r ; 1 n ; 1
j
n
CMD
2
1
q x
− α −
t
- I nt er valos Schef f é: int er valos basados en el mét odo de Schef f é, donde se
calculan t odos los cont rast es con al menos una confianza prefij ada. En est a
opción el er r or est ándar par a la media de cada gr upo j y los límit es del
int er valo vienen dados por
j
n
CMD
,
j
r n ; r ; 1
j
n
CMD
r F x
− α −
t
Manual G- St at 2. 0 161
- I nt er valos de Bonfer r oni: int er valos basados en el mét odo de Bonfer r oni,
donde se calculan los cont r ast es seleccionados con al menos una confianza
pr ef ij ada. En est a opción el er r or est ándar par a la media de cada gr upo j y
los límit es del int er valo vienen dados por
j
n
CMD
,
j
r n ; 1 ; 1
j
n
CMD
F x
b
− α −
t ,
( )
2
1 r r
b

α
· α
Compar aci ones Múl t i pl es
Se pr esent an pr uebas a post er ior i par a det er minar de qué gr upo pr ovienen las
dif er encias det ect adas en el ANOVA. Mediant e un ast er isco se señalan los
gr upos que son dif er ent es y mediant e un aspa se agr upan los gr upos
homogéneos o semej ant es.
En la pant alla de opciones se selecciona el mét odo que se desee para la
for mación de gr upos homogéneos de las medias. Exist en las siguient es
posibilidades:
- LSD: basado en el mét odo de Fisher de mínima difer encia significat iva
( least significant differ ence = LSD) , donde se compar an cualquier par de
medias con una confianza pr efij ada. En est a opción el límit e viene dado por

,
`

.
|
+ ⋅
− α −
j i
r n ; 1 ; 1
n
1
n
1
2
CMD
F 2
- HSD de Tukey: basado en el mét odo de Tukey de diferencia
“ honradament e” significat iva ( honest ly significant difference = HSD) ,
donde se compar an cada par de medias con una confianza pr efij ada. En
est a opción el límit e viene dado por

,
`

.
|
+
− α −
j i
r ; r n ; 1
n
1
n
1
2
CMD
q
- Scheffé: basado en el mét odo de Scheffé, donde se calculan t odos los
cont r ast es con al menos una confianza pr efij ada. En est a opción el límit e
vi ene dado por
( )

,
`

.
|
+ − ⋅
− − α −
j i
r n ; 1 r ; 1
n
1
n
1
2
CMD
1 r 2 F
162
- Bonfer r oni: basado en el mét odo de Bonfer r oni, donde se calculan los
cont rast es seleccionados con al menos una confianza prefij ada. En est a
opción el límit e viene dado por

,
`

.
|
+ ⋅
− α −
j i
r n ; 1 ; 1
n
1
n
1
2
CMD
F 2
b
( )
2
1 r r
b

α
· α
Homocedast i ci dad
El ANOVA r equier e que la var iabilidad dent r o de los gr upos sea homogénea
( hipót esis de homocedast icidad) . La hipót esis nula sería la homogeneidad de
los grupos ( homocedast icidad) y la alt ernat iva la no homogeneidad
( het er ocedast icidad) . Se pr esent an t r es pr uebas que cont r ast an est e aspect o:
C de Cochr an, Bar t let t y Levene. En el caso de que se obt enga una p< 0. 05 se
t endr ía que no se ver ificar ía est e supuest o, con lo que habr ía que int ent ar una
t r ansfor mación ( p. ej . la logar ít mica) de los dat os de la var iable cuant it at iva y
luego aplicar el ANOVA.
El est adíst ico de Cochran se calcula como
{ ¦

2
j
2
j
s
s máx
El est adíst ico de Bart let t se calcula como
( ) ( )
( ) ( ) ( )

,
`

.
|

∑ −

− −
+
∑ ∑ − − −
1 n
1
1 n
1
1 r 3
1
1
Lns 1 n Lns 1 n
j j
2
j j
2
j
con s
2
= CMD.
Par a calcular el est adíst ico de Levene se r ealiza, en pr imer lugar , una
t ransformación de la variable respuest a, considerando el valor absolut o de la
dif er encia ent r e el valor or iginal y la media del gr upo a la que per t enece la
observación. Es decir, la nueva variable respuest a es
j . ij
x x −
En segundo lugar se r ealiza un Anova de un fact or con est a nueva var iable
r espuest a. El valor F de dicho Anova es el est adíst ico F de Levene.
Manual G- St at 2. 0 163
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la Variable
explicat iva cualit at iva que forma los grupos. La variable respuest a no
puede ser const ant e. La var iable explicat iva debe t ener dos o más
gr upos.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
respuest a según las cat egorías de la variable explicat iva o fact or. Así,
par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Caj as: Gr áfico de Caj as de la var iable r espuest a par a los dist int os
valor es de la var iable explicat iva. Ver menú Gr áficos.
Anova: Result ados del Análisis de la Var ianza par a la compar ación de
medias de los dist int os gr upos.
Medi as e I C: Se muest r an par a cada uno de los gr upos, las medias de
la var iable r espuest a, j unt o con sus er r or es est ándar y sus int er valos
de confianza calculados según dist int os mét odos. Est os int er valos de
confianza se pueden represent ar gráficament e con la pest aña “ Gráfico
de Medi as” .
164
Opciones:
- Mét odo: Ninguno, Errores Est ándar ( agrupado) , Errores
Est ándar ( individual) , I nt ervalos de Confianza ( agrupado) ,
I nt ervalos de Confianza ( individual) , I nt ervalos LSD, I nt ervalos
HSD de Tukey, I nt er valos Scheffé e I nt er valos Bonfer r oni
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
Gr áf i co de Medi as: Se muest r an par a cada uno de los gr upos, las
medias de la variable cuant it at iva, j unt o con sus int ervalos de
confianza calculados según dist int os mét odos.
Opciones:
- Mét odo: Son los dados en la pest aña “ Medias e I C” .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Compar aci ones Múl t i pl es: Result ados de las pr uebas a post er ior i
par a det er minar de qué gr upo o gr upos pr ovienen las difer encias
det ect adas en el Anova. Est e pr ogr ama se basa en los r esult ados de las
comparaciones dos a dos obt enidas. Mediant e un ast erisco se señalan
los gr upos que son dif er ent es y mediant e un aspa se agr upan los
gr upos homogéneos o semej ant es.
Opciones:
- Mét odo: LSD, HSD de Tukey, Scheffé, Bonferroni.
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
Homocedast i ci dad: Result ados del cont rast e de la homogeneidad de
la var iabilidad dent r o de los gr upos mediant e las pr uebas C de
Cochr an, Bar t let t y Levene.
Resi duos vs Pr edi cci ones: Se represent an los residuales frent e a los
valor es que pr edice el modelo. Est e gr áf ico sir ve par a poder det ect ar
Manual G- St at 2. 0 165
falt a de homocedast icidad ( het er ocedast icidad) . La banda de r esiduos
deber ía ser similar en disper sión y simet r ía a lo lar go de t odos los
pr edichos.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
: Se desea r eal i zar l a pr ueba Anov a un f act or de l a v ar i abl e FC2FC1
con l a v ar i abl e St at us como ex pl i cat i v a.
Est adíst icos de la opción Anova Un Fact or.
Estadísticos para la variable FC2FC1 por STATUS
======================================================================
Grupos 1 2 3
----------------------------------------------------
N 17 11 12
Media 61.3529 68.4545 56.1667
Mediana 59.0000 69.0000 53.0000
Desviación Típica 11.1183 7.8913 10.5644
Mínimo 42.0000 60.0000 42.0000
Máximo 82.0000 82.0000 74.0000
Residuos fr ent e a Pr edicciones de la opción Anova Un Fact or .
166
Caj as de la opción Anova Un Fact or .
Result ados de la pr ueba Anova Un Fact or .
Anova Un Factor
==========================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: STATUS
Número de Casos: 40
--------------------------------------------------------------------------
Suma de Cuadrado
Cuadrados G.L. Medio F-valor p-valor
--------------------------------------------------------------------------
Entre Grupos 871.2237 2 435.6119 4.2102 0.0225
Dentro Grupos 3828.2763 37 103.4669
--------------------------------------------------------------------------
Total (corr.) 4699.5000 39
-------------------------------------------------------------------------
Medias e I C de la opción Anova Un Fact or con los int er valos LSD.
Anova Un Factor
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: STATUS
Número de Casos: 40
Tabla de Medias con I.C. LSD al 95.0%
---------------------------------------------------------------
Manual G- St at 2. 0 167
E.E. Límite Límite
STATUS N Media (agrupado) Inferior Superior
---------------------------------------------------------------
1 17 61.3529 2.4670 56.3542 66.3516
2 11 68.4545 3.0669 62.2403 74.6687
3 12 56.1667 2.9364 50.2170 62.1163
---------------------------------------------------------------
Total 40 61.7500
Gr áficos de Medias con I nt er valos er r or es est ándar
Compar aciones Múlt iples LSD de la opción Anova Un Fact or .
Anova Un Factor. Comparaciones Múltiples
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: STATUS
Número de Casos: 40
Método: LSD al 95.00%
--------------------------------------
Grupos
STATUS N Media Homogéneos
--------------------------------------
3 12 56.1667 X
1 17 61.3529 XX
2 11 68.4545 X
--------------------------------------
168
Contraste Diferencia +/- Límite
--------------------------------------
1 VS 2 -7.1016 7.9752
1 VS 3 5.1863 7.7708
2 VS 3 *12.2879 *8.6032
--------------------------------------
* Diferencia estadísticamente significativa.
Homocedast icidad de la opción Anova Un Fact or.
Anova Un Factor. Homocedasticidad
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: STATUS
Número de Casos: 40
Prueba C de Cochran: 0.4155 P-valor = 0.6692
Prueba de Bartlett: 1.3465 P-valor = 0.5101
Residuos vs Predicciones de la opción Anova Un Fact or.
Anova Un Fact or ( a| y) . Dat os Agr upados
A part ir de los dat os resumidos de t amaño muest ral, media y desviación t ípica
de cada uno de los gr upos, se puede r ealizar , sin el f icher o de dat os, la opción
Anova Un Fact or. Los fundament os t eóricos y la formulación son idént icos a los
Manual G- St at 2. 0 169
pr esent ados en las opciones ant er ior es r espect ivas con dat os a par t ir de
f i cher o.
Manej o del programa
Dat os Agr upados: Los dat os necesar i os son:
- Númer o de gr upos.
- Et i quet a de cada gr upo.
- Tamaño de cada gr upo.
- Media de los gr upos.
- Desviaciones t ípicas de cada gr upo.
En la pant alla de ent r ada de dat os agr upados, apar ecen, por def ect o,
t r es gr upos con dat os fict icios que hay que cambiar . Cada vez que se
r edefinen las dimensiones de la t abla apar ecen los valor es por defect o.
Los dat os, except o la et iquet a, deben ser numér icos. No dej ar f ilas o
columnas con t odos los valores falt ant es o con t odos los valores iguales
a cer o.
El r est o de las pest añas se manej a igual que en la opción Anova
ant er ior ( sin dat os agr upados) .
170
Kr usk al - Wal l i s ( a| y)
Realiza la prueba no paramét rica de Kruskal- Wallis. Asimismo, facilit a
compar aciones múlt iples a post er ior i según el mét odo de Dunn.
La prueba de Kruskal- Wallis es la más adecuada para comparar poblaciones
cuyas dist r ibuciones no son nor males. Es la pr ueba no par amét r ica análoga a
la pr ueba par amét r ica Anova. I ncluso cuando las poblaciones son nor males,
est e cont r ast e funciona muy bien. También es adecuado cuando las
desviaciones t ípicas de los difer ent es gr upos no son iguales ent r e sí, sin
embar go, el Anova de un fact or es muy r obust o y sólo se ve afect ado cuando
las desviaciones t ípicas dif ier en en gr an magnit ud.
Las hipót esis de la pr ueba de Kr uskal- Wallis son
H
0
: Las k medianas son t odas iguales
H
1
: Al menos una de las medianas es difer ent e
La prueba de Kruskal- Wallis proporciona información en cuant o a la posible
igualdad de medianas ent r e gr upos y per mit e r echazar est a hipót esis si p-
valor < 0. 05. En el caso de que se r echace la hipót esis nula de igualdad de
medianas se puede det er minar mediant e compar aciones múlt iples a post er ior i,
de qué gr upo o gr upos pr ovienen esas dif er encias.
Como paso pr evio al cálculo del est adíst ico de Kr uskal- Wallis, a cada
obser vación se le asigna el r ango según el or den que ocupa la obser vación en
el conj unt o t ot al de los dat os, asignando el r ango medio en caso de empat es. A
par t i r de est os r angos se def i ne R
m
como la suma de rangos de cada grupo m,
m = 1, …, r, siendo r el número de grupos, y se calculan el valor medio de los
r angos E[ R
m
] y el r ango medio m R como
[ ]
( )
2
1 n n
R E
m
m
+
·
m
m
m
n
R
R ·
Por últ imo, el est adíst ico de cont r ast e de Kr uskal- Wallis H’ se calcula como:
( )
[ ] [ ]
( )
n n
d d
1
R E R
n
1
1 n n
12
' H
3
k
1 j
j
3
j
r
1 m
2
m m
m

∑ −

∑ −
+
·
·
·
Manual G- St at 2. 0 171
si endo d
j
el númer o de empat es en j = 1, …, k con k el númer o de valor es
dist int os de la variable respuest a, que sigue una dist ribución Chi- Cuadrado con
r - 1 gr ados de liber t ad. Est e pr ogr ama pr opor ciona un p- valor asint ót ico par a
est a opci ón.
Para realizar comparaciones múlt iples a post eriori de los grupos se ut iliza la
pr ueba de Dunn. Par a llevar a cabo est a pr ueba se est ablece la difer encia
mínima ent re los rangos medios de dos grupos para decret ar la significación
est adíst ica a un nivel alfa det er minado. Est a difer encia viene dada por
( )
( )
( ) ( )
]
]
]
]

+
]
]
]

∑ − − −

> −
·

α

j i
t
1 m
m
3
m
2
1 k k
1
j i
n
1
n
1
d d 1 n n
1 n 12
1
z R R
donde
i
R es el r ango medio del gr upo i, z es el valor de la dist r ibución nor mal
unilat er al izquier da, alfa el nivel de significación, k el númer o de gr upos, n el
t amaño de l a muest r a, n
i
el t amaño del gr upo i, t el númer o de valor es
dist int os de la var iable r espuest a y d
m
el númer o de empat es par a el val or m
de la var iable r espuest a.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva u ordinal y la
Variable explicat iva cualit at iva que for ma los gr upos. La var iable
r espuest a no puede ser const ant e. La var iable explicat iva debe t ener
dos o más gr upos.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
respuest a según las cat egorías de la variable explicat iva o fact or. Así,
par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
172
Caj as: Gr áfico de Caj as de la var iable r espuest a par a los dist int os
valor es de la var iable explicat iva. Ver menú Gr áficos.
Kr usk al - Wal l i s: Result ado de la pr ueba de Kr uskal- Wallis.
Compar aci ones Múl t i pl es: Result ados de las comparaciones
múlt iples a post eriori por el mét odo de Dunn para det erminar de qué
gr upo o gr upos pr ovienen las difer encias det ect adas en la pr ueba de
Kr uskal- Wallis. Est e pr ogr ama se basa en los r esult ados de las
comparaciones dos a dos obt enidas. Mediant e un ast erisco se señalan
los gr upos que son dif er ent es y mediant e un aspa se agr upan los
gr upos homogéneos o semej ant es.
Opciones:
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
: Se desea r eal i zar l a pr ueba de Kr usk al - Wal l i s de l a var i abl e
FC2FC1 con l a v ar i abl e St at us como ex pl i cat i v a.
Result ados de la pest aña Kr uskal- Wallis.
Kruskal-Wallis
======================================================================
Variable Respuesta: FC2FC1
Variable Explicativa: STATUS
Número de Casos: 40
-----------------------------------------------------
Grupos N Suma de Rangos Rm Rango Medio
-----------------------------------------------------
1 17 338.0000 19.8824
2 11 306.5000 27.8636
3 12 175.5000 14.6250
-----------------------------------------------------
Estadístico de Kruskal-Wallis (sin corrección por empates): 7.4424
Estadístico de Kruskal-Wallis (con corrección por empates): 7.4606
Grados de Libertad: 2
p-valor: 0.0240
Manual G- St at 2. 0 173
Result ados de la pr ueba de compar aciones múlt iples a post er ior i de Dunn.
Kruskal-Wallis, Comparaciones Múltiples
======================================================================
Variable Respuesta: EDAD
Variable Explicativa: STATUS
Número de Casos: 40
Método: Dunn al 95.0%
----------------------------------------
Grupos
EDAD N Rango Medio Homogéneos
----------------------------------------
2 11 15.3182 X
1 17 20.5000 X
3 12 25.2500 X
----------------------------------------
--------------------------------------
Contraste Diferencia +/- Límite
--------------------------------------
2 VS 1 5.1818 10.8234
3 VS 1 -4.7500 10.5461
3 VS 2 -9.9318 11.6757
--------------------------------------
* Diferencia estadísticamente significativa.
Anova Un Fact or con Bl oque ( a bl oque| y)
Realiza la pr ueba Anova un fact or con bloque. Asimismo, facilit a, ent r e ot r as
t écnicas asociadas a ella, las compar aciones múlt iples a post er ior i.
El Análisis de la Varianza de un fact or con bloque compara medias ent re
dist int os gr upos y se basa en descomponer la var iabilidad t ot al en t r es
component es: uno que se at r ibuye al hecho de per t enecer a un bloque u ot r o
SCB, un segundo al de per t enecer a un gr upo u ot r o SCG y un t er cer o con
or igen desconocido r esidual SCR. Se supone que la var iable explicat iva es un
f act or f ij o y que la var iable bloque es un f act or aleat or io.
El programa proporciona la significación del fact or y del bloque. El est adíst ico
de cont r ast e que se usa es el F par a los gr upos. La hipót esis nula de igualdad
de medias se r echaza en el caso en el que p- valor < 0. 05, en caso cont r ar io no
hay evidencia suficient e par a poder r echazar la. En el caso de que se r echace la
hipót esis nula de igualdad de medias se puede det erminar mediant e
compar aciones múlt iples a post er ior i, de qué gr upo o gr upos pr ovienen esas
diferencias
174
Si se denot a por y al vect or con los valores de la variable respuest a, con X
g
a la
mat riz de n filas por ( 1+ r
g
- 1) columnas con la pr imer a columna t odo de unos y
las rest ant es ( r
g
- 1) columnas, las asociadas a las var iables dummy de la
var iable explicat iva con r
g
niveles, con X a la mat riz de n filas por ( 1+ r
g
-1+ r
b
-
1) columnas result ant e de añadir ( r
b
- 1) col umnas a l a mat r i z ant er i or X
g
,
asociadas a las var iables dummy de la var iable que for ma los bloques con r
b
ni vel es.
Se t iene que las expresiones para SCT ( suma de cuadrados t ot al) , SCB ( suma
de cuadrados de la variable bloque) , SCG ( suma de cuadrados de la variable
que forma los grupos) , SCR ( suma de cuadrados residual) , GLT ( grados de
libert ad t ot al) , GLB ( grados de libert ad de la variable bloque) , GLG ( grados de
libert ad de la variable que forma los grupos) , GLR ( grados de libert ad residual) ,
CMB ( cuadrado medio de la variable bloque) , CMG ( cuadrado medio de la
variable que forma los grupos) , CMR ( cuadrado medio residual) , F
b
( est adíst ico
de cont r ast e par a la var iable bloque) y F
g
( est adíst ico de cont r ast e par a la
var iable que for ma los gr upos) son:
( ) ( ) y y y y SCT
t
− − ·
( ) ( )
g g
t
g g
b X y b X y SCT SCG − − − · , ( ) y X X X b
t
g
1
g
t
g g

·
( ) ( ) Xb y Xb y SCR
t
− − · , ( ) y X X X b
t
1
t

·
SCR SCG SCT SCB − − ·
1 n GLT − · , 1 r GLB
b
− · , 1 r GLG
g
− · , GLG GLB GLT GLR − − ·
GLB
SCB
CMB · ,
GLG
SCG
CMG · ,
GLR
SCR
CMR ·
CMR
CMB
F
b
· ,
CMR
CMG
F
g
·
El est adíst ico de cont r ast e F
b
sigue una dist ribución F de Snedecor con grados
de libert ad del numerador GLB y grados de libert ad del denominador GLR. El
est adíst i co F
g
sigue una dist r ibución F de Snedecor con gr ados de liber t ad del
numerador GLG y grados de libert ad del denominador GLR.
Medi as e I C
Se muest r an par a cada uno de los gr upos, las medias de la var iable
cuant it at iva, j unt o con su error est ándar y sus int ervalos de confianza
calculados según dist int os mét odos. Est os int er valos de confianza se pueden
r epr esent ar gr áficament e con la pest aña “ Gr áfico de Medias” .
Manual G- St at 2. 0 175
En la pant alla de opciones se selecciona el mét odo que se desee par a el
cálculo de los int er valos de las medias. Exist en las siguient es posibilidades:
ninguno, errores est ándar, int ervalos de confianza, int ervalos LSD, int ervalos
HSD, int er valos Scheffé, int er valos de Bonfer r oni. Las fór mulas son análogas a
las dadas en Anova / Anova / Medias e I C, aunque el cálculo de los er r or es
est ándar viene dado por
( )
t
1
* t
l X X X l ⋅ ⋅

donde l es un vect or para cada posible media con ( 1+ ( r
g
- 1) + ( r
b
- 1) )
coordenadas, donde la primera component e es uno, las component es relat ivas
a cada var iable explicat iva es 1 en la cor r espondient e var iable dummy y cer o
en caso cont rario, y las component es relat ivas a la ot ra variable explicat iva es
el inverso del número de cat egorías de dicha variable explicat iva.
Por ej emplo, si la variable que forma los grupos t iene dos cat egorías y la
variable que forma los bloques t ambién t iene dos cat egorías, para la primera
cat egor ía de la var iable que for ma los gr upos el vect or l es ( 1, 1, 1/ 2) y par a
la segunda cat egor ía de la var iable que for ma los gr upos el vect or l es ( 1, 0,
1/ 2) . Sólo se calculan medias par a el f act or f ij o.
La mat r iz X
*
es una mat r iz de dimensiones n por n f or mada por r
g
bloques de
dimensión n/ r
g
por n/ r
g
iguales a cer o y bloques ABLOQ de dimensión n/ r
g
por
n/ r
g
en la diagonal principal, siendo

,
`

.
|
+
+
+
·
b a a a a
... ... ... ...
a ... b a a
a ... a b a
ABLOQ
con
b
r / n
CMR CMB
a

· y CMR b ·
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva, la Variable
explicat iva cualit at iva y la Variable bloque t ambién cualit at iva. Par a la
aplicación de est a t écnica es necesario que los dat os est én balanceados
para los dos fact ores, est o significa que t odas las casillas de la posible
int er acción a* b t engan el mismo númer o de casos, si no es así el
pr ogr ama devuelve un mensaj e de er r or .
176
Est adíst i cos: Est adíst icos de la var iable r espuest a según las
cat egorías de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
respuest a según las cat egorías de la variable explicat iva o fact or. Así,
par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Caj as: Gr áfico de Caj as de la var iable r espuest a par a los dist int os
valor es de la var iable explicat iva. Ver menú Gr áficos.
Anova: Result ados del Análisis de la Var ianza de un fact or con bloque
par a la compar ación de medias de los dist int os gr upos.
Medi as e I C: Se muest r an par a cada uno de los gr upos, las medias de
la variable respuest a, j unt o con su error est ándar y sus int ervalos de
confianza calculados según dist int os mét odos. Est os int ervalos de
confianza se pueden represent ar gráficament e con la pest aña “ Gráfico
de Medi as” .
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
Gr áf i co de Medi as: Se muest r an par a cada uno de los gr upos, las
medias de la variable respuest a, j unt o con sus int ervalos de confianza
calculados según dist int os mét odos.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
Manual G- St at 2. 0 177
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Compar aci ones Múl t i pl es: Result ados de las pr uebas a post er ior i
par a det er minar de qué gr upo o gr upos pr ovienen las difer encias
det ect adas en el Anova. Est e pr ogr ama se basa en los r esult ados de las
comparaciones dos a dos obt enidas. Mediant e un ast erisco se señalan
los gr upos que son dif er ent es y mediant e un aspa se agr upan los
gr upos homogéneos o semej ant es.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
Resi duos vs Pr edi cci ones: Se represent an los residuales frent e a los
valor es que pr edice el modelo. Est e gr áf ico sir ve par a poder det ect ar
falt a de homocedast icidad ( het er ocedast icidad) . La banda de r esiduos
deber ía ser similar en disper sión y simet r ía a lo lar go de t odos los
pr edichos.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
178
: Real i zar l a pr ueba Anov a un f act or con bl oques con l a v ar i abl e
FC2 como v ar i abl e r espuest a, Far maco como v ar i abl e ex pl i cat i v a y
Sex o como var i abl e bl oque. Par a que el di seño est é bal anceado
cambi ar l a v ar i abl e Sex o= 2, en l os casos I B= 27 y I B= 30.
Var iables en la opción Anova Un Fact or con Bloques.
Disper sión en la opción Anova Un Fact or con Bloques.
Manual G- St at 2. 0 179
Result ados del Anova Un Fact or con Bloques.
Anova Un Factor con Bloques
=============================================
Variable Respuesta: FC2
Variable Explicativa: FARMACO
Variable Bloque: SEXO
Número de Casos: 40
Anova
--------------------------------------------------------------------
Suma de Cuadrado
Cuadrados G.L. Medio F-valor p-valor
--------------------------------------------------------------------
Entre Bloques 2190.4000 1 2190.4000 17.3711 0.0002
Entre Grupos 22.5000 1 22.5000 0.1784 0.6752
Residual 4665.5000 37 126.0946
--------------------------------------------------------------------
Total (corr.) 6878.4000 39
Medias e I C de la opción Anova Un Fact or con Bloques con los int er valos LSD.
Anova Un Factor con Bloques
=============================================
Variable Respuesta: FC2
Variable Explicativa: FARMACO
Variable Bloque: SEXO
Número de Casos: 40
Tabla de medias con I.C. LSD al 95.0%
-----------------------------------------------------------
Límite Límite
FARMACO n Media E.E. Inferior Superior
-----------------------------------------------------------
1 20 136.9500 7.6100 121.5306 152.3694
2 20 138.4500 7.6100 123.0306 153.8694
-----------------------------------------------------------
Total 2 137.7000
Comparaciones múlt iples LSD de la opción Anova Un Fact or con Bloques.
Anova Un Factor con Bloques. Comparaciones Múltiples
======================================================================
Variable Respuesta: FC2
Variable Explicativa: FARMACO
180
Variable Bloque: SEXO
Número de Casos: 40
con I.C. LSD al 95.0%
----------------------------------------
Grupos
FARMACO n Media Homogéneos
----------------------------------------
1 20 136.9500 X
2 20 138.4500 X
----------------------------------------
Contraste Diferencia +/- Límite
--------------------------------------
1 VS 2 -1.5000 7.1949
--------------------------------------
* Diferencia estadísticamente significativa.
Fr i edman ( a bl oque| y)
Realiza la pr ueba no par amét r ica de Fr iedman.
La pr ueba de Fr iedman es la análoga no par amét r ica del Anova de un f act or
con muest ras ( bloques) pareadas, con lo que compara varias medianas en
lugar de var ias medias. Como t oda t écnica no par amét r ica funciona con r angos
en lugar de con los valor es or iginales de la var iable r espuest a. Se basa en
descomponer la var iabilidad t ot al en t r es component es: uno que se at r ibuye al
hecho de per t enecer a un bloque u ot r o, un segundo al de per t enecer a un
gr upo u ot r o y un t er cer o con or igen desconocido.
Se supone que la var iable explicat iva t iene k niveles y que hay b bloques.
Dent r o de cada bloque se asignan r angos a la var iable r espuest a, en el caso de
empat es se consider an los pr omedios de los ór denes de las obser vaciones
empat adas. Para cada nivel j , j = 1, …, k, se suman dichos rangos, obt eniéndose
R
j
. Est os rangos verifican que
( )
b
2
1 k k
R
k
1 j
j
+
· ∑
·
El est adíst ico de cont rast e se calcula como
( )W 1 k b
2
F
− · χ
que sigue una dist ribución Chi- Cuadrado con k- 1 grados de libert ad, siendo
Manual G- St at 2. 0 181
( )
( ) ( ) ∑ − − −
+ −

,
`

.
|

·
·
empat es
3 2 2
2 2
k
1 j
2
j
empat es empat es b 1 k k b
1 k k b 3 R 12
W
Est e pr ogr ama pr opor ciona un p- valor asint ót ico par a est a opción. La hipót esis
nul a de i gual dad de medi anas en l os gr upos se r echaza en el caso en el que p-
valor < 0. 05, en caso cont r ar io no hay evidencia suficient e par a poder
r echazar la.
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva, la Variable
explicat iva cualit at iva y la Variable bloque t ambién cualit at iva. La
variable bloque est á asociada al suj et o, que present a dat os
longit udinales par a cada una de las cat egor ías del fact or analizado. El
f act or puede ser , en muchas ocasiones, dif er ent es t iempos en un
est udio de diseño longit udinal. Par a la aplicación de est a t écnica es
r equisit o que los dat os est én balanceados y que solament e haya una
única observación para cada posible combinación de la variable
explicat iva y del bloque. Si no es así, el pr ogr ama devuelve el siguient e
mensaj e de er r or :
ERROR :
La prueba de Friedman requiere datos balanceados y que solamente
haya una única observación para cada posible combinación de la
variable explicativa y del bloque.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las
cat egorías de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
respuest a según las cat egorías de la variable explicat iva o fact or. Así,
par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
182
Caj as: Gr áfico de Caj as de la var iable r espuest a par a los dist int os
valor es de la var iable explicat iva. Ver menú Gr áficos.
Fr i edman: Result ados de la pr ueba de Fr iedman.
: Se anal i zan t r es t r at ami ent os en sei s suj et os. Se asume que el
or den de admi ni st r aci ón no i nf l uy e en l a r espuest a. Se pr et ende
est abl ecer si hay di f er enci a ent r e t r at ami ent os. Los dat os son l os
si gui ent es:
suj t r at resp
1 1 9
1 2 6
1 3 5
2 1 11
2 2 8
2 3 7
3 1 9
3 2 7
3 3 6
4 1 12
4 2 9
4 3 9
5 1 7
5 2 4
5 3 4
6 1 19
6 2 16
6 3 17
Result ados de la est adíst ica descr ipt iva.
Anova Friedman. Estadísticos
======================================================================
Variable Respuesta: resp
Variable Explicativa: trat
Variable Bloque: sujeto
Número de Casos: 18
Manual G- St at 2. 0 183
Desviación
Grupos | N Media Mediana Típica Mínimo Máximo
-----------------------------------------------------------------
1 | 6 11.1667 10.0000 4.2151 7.0000 19.0000
2 | 6 8.3333 7.5000 4.1312 4.0000 16.0000
3 | 6 8.0000 6.5000 4.7329 4.0000 17.0000
-----------------------------------------------------------------
Total | 18 9.1667 8.5000 4.3555 4.0000 19.0000
Result ados de la pr ueba de Fr iedman.
Friedman
======================================================================
Variable Respuesta: resp
Variable Explicativa: trat
Variable Bloque: sujeto
Número de Casos: 18
Grupos N Rango Medio
-----------------------------
1 6 3.0000
2 6 1.6667
3 6 1.3333
-----------------------------
Coeficiente de Concordancia: 0.8485
Estadístico de Contraste: 10.1818
p-valor: 0.0062
La prueba t iene en cuent a la información del bloque ( suj et o) . Est e análisis
realizado - erróneament e- por Kruskal- Wallis no hubiera det ect ado diferencias
significat ivas ent r e t r at amient os.
Anacova ( ax | y)
Realiza la pr ueba del análisis de la covar ianza, Anacova, con y sin
int er acciones. Asimismo, facilit a, ent r e ot r as t écnicas asociadas a ella, las
comparaciones múlt iples a post eriori.
El Anacova o Análisis de la Varianza de un fact or con covariable se basa en
descomponer la variabilidad t ot al SCT en t res component es: uno que se
at r ibuye a la covar iable SCC, un segundo al hecho de per t enecer a un gr upo u
ot ro SCE y un t ercero con origen desconocido residual SCR.
184
Si se denot a por y al vect or con los valores de la variable respuest a, con X
c
a la
mat r iz de n f ilas por dos columnas con la pr imer a columna t odo de unos y la
segunda columna con los valores de la covariable y con X a la mat riz de n filas
por ( 1+ 1+ r- 1) columnas result ant e de añadir ( r- 1) columnas a la mat riz
ant er ior X
c
, asociadas a las var iables dummy de la var iable explicat iva con r
ni vel es.
Se t iene que las expr esiones par a SCT ( suma de cuadr ados t ot al) , SCC ( suma
de cuadr ados de la covar iable) , SCE ( suma de cuadr ados ent r e los gr upos) ,
SCR ( suma de cuadrados residual) , GLT ( grados de libert ad t ot al) , GLC ( grados
de liber t ad de la covar iable) , GLE ( gr ados de liber t ad ent r e los gr upos) , GLR
( grados de libert ad residual) , CMC ( cuadrado medio de la covariable) , CME
( cuadrado medio ent re grupos) , CMR ( cuadrado medio residual) , F
c
( est adíst ico
de cont r ast e par a la covar iable) y F
e
( est adíst ico de cont rast e para la variable
que for ma los gr upos) son:
( ) ( ) y y y y SCT
t
− − ·
( ) ( )
c c
t
c c
b X y b X y SCT SCC − − − · , ( ) y X X X b
t
c
1
c
t
c c

·
( ) ( ) Xb y Xb y SCR
t
− − · , ( ) y X X X b
t
1
t

·
SCR SCC SCT SCE − − ·
1 n GLT − · , 1 GLC · , 1 r GLE − · , GLE GLC GLT GLR − − ·
GLC
SCC
CMC · ,
GLE
SCE
CME · ,
GLR
SCR
CMR ·
CMR
CMC
F
c
· ,
CMR
CME
F
e
·
El est adíst ico de cont r ast e F
c
sigue una dist ribución F de Snedecor con grados
de libert ad del numerador GLC y grados de libert ad del denominador GLR. El
est adíst i co F
e
sigue una dist r ibución F de Snedecor con gr ados de liber t ad del
numerador GLE y grados de libert ad del denominador GLR. La hipót esis nula de
i gual dad de medi as se r echaza en el caso en el que F
e
t enga un p- valor < 0. 05,
en caso cont rario no hay evidencia suficient e para poder rechazarla. En el caso
de que se r echace la hipót esis nula de igualdad de medias se puede det er minar
mediant e comparaciones múlt iples a post eriori, de qué grupo o grupos
pr ovienen esas dif er encias.
Manual G- St at 2. 0 185
Medi as e I C
Se muest r an par a cada uno de los gr upos, las medias de la var iable
cuant it at iva, j unt o con su error est ándar y sus int ervalos de confianza
calculados según dist int os mét odos. Est os int er valos de confianza se pueden
r epr esent ar gr áficament e con la pest aña “ Gr áfico de Medias” .
En la pant alla de opciones se selecciona el mét odo que se desee par a el
cálculo de los int er valos de las medias. Exist en las siguient es posibilidades:
ninguno, errores est ándar, int ervalos de confianza, int ervalos LSD, int ervalos
HSD, int er valos Scheffé, int er valos Bonfer r oni. Las fór mulas son análogas a las
dadas en Anova / Anova / Medias e I C, aunque el cálculo de los er r or es
est ándar viene dado por
( )
t
1
t
l X X l CMR ⋅ ⋅ ⋅

,
donde l es un vect or para cada posible media con ( 1+ ( r- 1) + 1) coordenadas,
donde la pr imer a component e es uno, las siguient es ( r - 1) component es son 1
si es la correspondient e variable dummy y cero en caso cont rario, y la últ ima
component e es la media de la covar iable. Por ej emplo, si la var iable explicat iva
t iene t res cat egorías, para la primera cat egoría el vect or l es ( 1, 1, 0, media de
la covar iable) , par a la segunda cat egor ía el vect or l es ( 1, 0, 1, media de la
covariable) y para la t ercera cat egoría es ( 1, 0, 0, media de la covariable) .
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva, la Variable
explicat iva cualit at iva ( fact or ) y la Covariable cuant it at iva. Ni la
variable respuest a ni la covariable pueden ser const ant es. La variable
explicat iva debe t ener dos o más gr upos.
Est adíst i cos: Est adíst icos de la var iable r espuest a según las cat egor ías
de la variable explicat iva. Se det allan en Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
respuest a según las cat egorías de la variable explicat iva o fact or. Así,
par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
186
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Caj as: Gr áfico de Caj as de la var iable r espuest a par a los dist int os
valor es de la var iable explicat iva. Ver menú Gr áficos.
Anova: Result ado del Análisis de la Var ianza de un fact or con
covar iable par a la compar ación de medias de los dist int os gr upos en
pr esencia de una covar iable.
Medi as e I C: Se muest r an par a cada uno de los gr upos, las medias de
la variable respuest a, j unt o con su error est ándar y sus int ervalos de
confianza calculados según dist int os mét odos. Est os int ervalos de
confianza se pueden represent ar gráficament e con la pest aña “ Gráfico
de Medi as” .
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
Gr áf i co de Medi as: Se muest r an par a cada uno de los gr upos, las
medias de la variable respuest a, j unt o con sus int ervalos de confianza
calculados según dist int os mét odos.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Compar aci ones Múl t i pl es: Result ados de las pr uebas a post er ior i
par a det er minar de qué gr upo o gr upos pr ovienen las difer encias
det ect adas en el Anova. Est e pr ogr ama se basa en los r esult ados de las
comparaciones dos a dos obt enidas. Mediant e un ast erisco se señalan
Manual G- St at 2. 0 187
los gr upos que son dif er ent es y mediant e un aspa se agr upan los
gr upos homogéneos o semej ant es.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
Resi duos vs Gr upos: Se r epr esent an los r esiduales par a cada uno de
los gr upos. Los r esiduales se calculan como la difer encia ent r e el valor
observado y el valor que predice el modelo. Est e gráfico sirve para
poder det ect ar falt a de homocedast icidad ( het erocedast icidad) . Los
gr upos deber ían t ener disper siones de los r esiduos similar es.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Resi duos vs Pr edi cci ones: Se represent an los residuales frent e a los
valor es que pr edice el modelo. Est e gr áf ico sir ve par a poder det ect ar
falt a de homocedast icidad ( het er ocedast icidad) . La banda de r esiduos
deber ía ser similar en disper sión y simet r ía a lo lar go de t odos los
pr edichos.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Resi duos vs Regi st r os: Se r epr esent an los r esiduales f r ent e al
númer o de r egist r o en la base de dat os. Est e gr áf ico no deber ía
most rar ningún pat rón no aleat orio. Así, para cada una de las unidades
de est udio del ficher o de t r abaj o ( las filas o r egist r os) , que apar ecen
en el ej e X, se muest r a el valor del r esiduo del modelo est imado. Si la
nube de punt os no muest r a ninguna paut a o pat r ón ( el r ango de
oscilación de los r esiduos no depende del valor de la fila, no se obser va
periodos cont inuados de residuos crecient es o decrecient es, et c. ) , se
t endr á una indicación gr áf ica de que los r esiduos son incor r elados: el
er r or comet ido par a una unidad de est udio no depende de los er r or es
comet idos par a las unidades inmediat ament e ant er ior es.
188
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
: Apl i car l a pr ueba Anacov a a l a v ar i abl e r espuest a FC2, con l a
v ar i abl e Far maco como v ar i abl e ex pl i cat i v a y FC1 como cov ar i abl e.
Result ados de la est adíst ica descr ipt iva.
Anacova. Estadísticos
======================================================================
Variable Respuesta: FC2
Variable(s) Explicativa(s): FARMACO, FC1
Número de Casos: 40
Desviación
Grupo N Media Mediana Típica Mínimo Máximo
-------------------------------------------------------------------
1 20 136.9500 137.0000 13.3435 116.0000 158.0000
2 20 138.4500 137.0000 13.5199 112.0000 165.0000
-------------------------------------------------------------------
Total 40 137.7000 137.0000 13.2804 112.0000 165.0000
FC1 40 75.9500 74.0000 9.5379 62.0000 96.0000
Anova de l a opci ón Anacova.
Anacova
======================================================================
Variable Respuesta: FC2
Variable(s) Explicativa(s): FARMACO, FC1
Número de Casos: 40
Anova
----------------------------------------------------------------------
Suma de Cuadrado
Cuadrados G.L. Medio F-valor p-valor
--------------------------------------------------------------------------
Covariable 2310.9613 1 2310.9613 18.7858 0.0001
Entre Grupos 15.8266 1 15.8266 0.1287 0.7219
Residual 4551.6121 37 123.0165
----------------------------------------------------------------------
Total (corr.) 6878.4000 39
Manual G- St at 2. 0 189
Medias e I C de la opción Anacova con los int er valos LSD.
Anacova. Medias e I.C.
======================================================================
Variable Respuesta: FC2
Variable(s) Explicativa(s): FARMACO, FC1
Número de Casos: 40
Tabla de Medias con I.C. LSD al 95.0%
--------------------------------------------------------------
Límite Límite
FARMACO N Media E. E. Inferior Superior
--------------------------------------------------------------
1 20 137.0709 2.4802 133.5174 140.6244
2 20 138.3291 2.4802 134.7756 141.8826
--------------------------------------------------------------
Total 40 137.7000
Gr áficos de Medias con I nt er valos er r or es est ándar
Compar aciones Múlt iples por Bonfer r oni de la opción Anacova.
Anacova. Comparaciones Múltiples
======================================================================
Variable Respuesta: FC2
Variable(s) Explicativa(s): FARMACO, FC1
Número de Casos: 40
190
con I.C. Bonferroni al 95.0%
----------------------------------------
Grupos
FARMACO n Media Homogéneos
----------------------------------------
1 20 137.0709 X
2 20 138.3291 X
----------------------------------------
Contraste Diferencia +/- Límite
--------------------------------------
1 VS 2 -1.2582 7.1075
--------------------------------------
* Diferencia estadísticamente significativa.
Residuos vs Pr edicciones de la opción Anacova.
Manual G- St at 2. 0 191
Residuos vs Regist r os de la opción Anacova.
No se observan t endencias, pat rones, ni variaciones en la dispersión de los
r esiduos.
Anova Dos Fact or es ( ab| y)
Realiza la pr ueba de Anova con dos fact or es con y sin int er acción. Asimismo,
f acilit a, ent r e ot r as t écnicas asociadas a ella, las compar aciones múlt iples a
post eriori.
El Análisis de la Var ianza de dos fact or es se basa en descomponer la
variabilidad t ot al SCT en t res component es: uno para un fact or SCA, un
segundo par a el ot r o fact or SCB y un t er cer o con or igen desconocido SCR.
Se denot a por y al vect or con los valor es de la var iable r espuest a, con X
a
a la
mat riz de n filas por ( 1+ r
a
- 1) columnas con la pr imer a columna t odo de unos y
las rest ant es ( r
a
- 1) columnas, las asociadas a las var iables dummy de la
pr imer a var iable explicat iva con r
a
niveles, con X a la mat r iz de n filas por
(1+ r
a
-1+ r
b
- 1) columnas r esult ant es de añadir ( r
b
- 1) columnas a la mat r iz
ant erior X
a
, asociadas a las var iables dummy de la segunda var iable explicat iva
con r
b
ni vel es.
Se t iene que las expresiones para SCT ( suma de cuadrados t ot al) , SCA ( suma
de cuadrados de la primera variable explicat iva) , SCB ( suma de cuadrados de
la segunda variable explicat iva, SCR ( suma de cuadrados residual) , GLT
( grados de libert ad t ot al) , GLA ( grados de libert ad de la primera variable
192
explicat iva) , GLB ( grados de libert ad de la segunda variable explicat iva) , GLR
( grados de libert ad residual) , CMA ( cuadrado medio de la primera variable
explicat iva) , CMB ( cuadrado medio de la segunda variable explicat iva) , CMR
( cuadrado medio residual) , F
a
( est adíst ico de cont rast e para la primera variable
explicat iva) y F
b
( est adíst ico de cont r ast e par a la segunda var iable explicat iva)
son:
( ) ( ) y y y y SCT
t
− − ·
( ) ( )
a a
t
a a
b X y b X y SCT SCA − − − · , ( ) y X X X b
t
a
1
a
t
a a

·
( ) ( ) Xb y Xb y SCR
t
− − · , ( ) y X X X b
t
1
t

·
SCR SCA SCT SCB − − ·
1 n GLT − · , 1 r GLA
a
− · , 1 r GLB
b
− · , GLB GLA GLT GLR − − ·
GLA
SCA
CMA · ,
GLB
SCB
CMB · ,
GLR
SCR
CMR ·
CMR
CMA
F
a
· ,
CMR
CMB
F
b
·
El est adíst ico de cont r ast e F
a
sigue una dist ribución F de Snedecor con grados
de libert ad del numerador GLA y grados de libert ad del denominador GLR. El
est adíst i co F
b
sigue una dist r ibución F de Snedecor con gr ados de liber t ad del
numerador GLB y grados de libert ad del denominador GLR. Para cada fact or, la
hipót esis nula de igualdad de medias se r echaza en el caso en el que su F
t enga un p- valor < 0. 05, en caso cont r ar io no hay evidencia suf icient e par a
poder r echazar la. En el caso de que se r echace la hipót esis nula de igualdad de
medias se puede det er minar mediant e compar aciones múlt iples a post er ior i, de
qué gr upo o gr upos pr ovienen esas difer encias.
Se incluye t ambién la posibilidad de cont emplar la int er acción ent r e los dos
fact or es, que a efect os comput acionales es como un nuevo fact or que se cr ea a
par t ir de la combinación de los niveles de los dos fact or es. La hipót esis nula del
fact or de int er acción est á r elacionada con la ausencia de int er acción. Si su F
t iene un p- valor < 0. 05 se r echaza la ausencia de int er acción.
Medi as e I C
Se muest r an par a cada uno de los gr upos, las medias de la var iable
cuant it at iva, j unt o con su error est ándar y sus int ervalos de confianza
calculados según dist int os mét odos. Est os int er valos de confianza se pueden
r epr esent ar gr áficament e con la pest aña “ Gr áfico de Medias” .
Manual G- St at 2. 0 193
En la pant alla de opciones se selecciona el mét odo que se desee par a el
cálculo de los int er valos de las medias. Exist en las siguient es posibilidades:
ninguno, errores est ándar, int ervalos de confianza, int ervalos LSD, int ervalos
HSD, int er valos Scheffé, int er valos Bonfer r oni. Las fór mulas son análogas a las
dadas en Anova / Anova / Medias e I C, aunque el cálculo de los er r or es
est ándar viene dado por
( )
t
1
t
l X X l CMR ⋅ ⋅ ⋅

,
donde l es un vect or para cada posible media con ( 1+ ( r
a
- 1) + ( r
b
- 1) )
coordenadas, donde la primera component e es uno, las component es relat ivas
a cada var iable explicat iva es 1 en la cor r espondient e var iable dummy y cer o
en caso cont rario, y las component es relat ivas a la ot ra variable explicat iva es
el inverso del número de cat egorías de dicha variable explicat iva.
Por ej emplo, si la primera variable explicat iva t iene t res cat egorías y la
segunda variable explicat iva t iene dos cat egorías, para la primera cat egoría de
la pr imer a var iable explicat iva el vect or l es ( 1, 1, 0, 1/ 2) , par a la segunda
cat egor ía de la pr imer a var iable explicat iva el vect or l es ( 1, 0, 1, 1/ 2) , par a la
t ercera cat egoría de la primera variable explicat iva es ( 1, 0, 0, 1/ 2) , para la
pr imer a cat egor ía de la segunda var iable explicat iva el vect or l es ( 1, 1/ 3, 1/ 3,
1) y par a la segunda cat egor ía de la segunda var iable explicat iva el vect or l es
( 1, 1/ 3, 1/ 3, 0) .
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y las dos
Variables explicat ivas cualit at ivas que forman los grupos. La variable
r espuest a no puede ser const ant e. Las var iables explicat ivas deben
t ener dos o más gr upos.
Est adíst i cos: Est adíst icos de la variable respuest a para cada cat egoría
de las variables explicat ivas y sus combinaciones. Se det allan en
Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
r espuest a según las cat egor ías de cada var iable explicat iva o fact or .
Así, par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
194
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
Anova: Result ados del Análisis de la Var ianza de dos fact or es par a la
compar ación de medias de los dist int os gr upos.
Opciones:
- I ncluir o no el t ér mino int er acción en el modelo.
Medi as e I C: En est a t abla se muest r an par a cada uno de los gr upos
de los dos fact ores, las medias de la variable respuest a, j unt o con su
er r or est ándar y sus int er valos de confianza calculados según dist int os
mét odos. Est os int er valos de confianza se pueden r epr esent ar
gr áficament e con la pest aña “ Gr áfico de Medias” .
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- I ncluir o no el t ér mino int er acción en el modelo.
Gr áf i co de Medi as: Se muest r an par a cada uno de los gr upos de los
dos fact ores, las medias de la variable respuest a, j unt o con sus
int er valos de confianza calculados según dist int os mét odos.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
- I ncluir o no el t ér mino int er acción en el modelo.
Manual G- St at 2. 0 195
Compar aci ones Múl t i pl es: Result ados de las pr uebas a post er ior i
par a det er minar de qué gr upo o gr upos de los dos f act or es pr ovienen
las difer encias det ect adas en el Anova. Est e pr ogr ama se basa en los
r esult ados de las compar aciones dos a dos obt enidas. Mediant e un
ast er isco se señalan los gr upos que son difer ent es y mediant e un aspa
se agr upan los gr upos homogéneos o semej ant es.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de confianza ent re > 0 y < 100.
- I ncluir o no el t ér mino int er acción en el modelo.
Gr áf i co I nt er acci ones: El obj et ivo de est e gr áf ico es det ect ar la
posible int er acción ent r e los fact or es, que se pr esent a en el caso de
que en el gr áfico no haya par alelismo ent r e las r ect as. En caso de que
haya int eracción, la int erpret ación de la influencia de los fact ores no es
direct a. La propia combinación de los efect os de cada uno de los
fact or es que for man par t e del est udio, puede ser el r esult ado de la
variabilidad de la variable respuest a, lo que se conoce como
int eracción. Gráficament e la int eracción de fact ores se reflej a mediant e
la ausencia de par alelismo de las r ect as que unen las medias.
: Apl i car l a pr ueba del Anova dos f act or es par a anal i zar l a var i abl e
FC2FC1 como v ar i abl e r espuest a empl eando l as v ar i abl es Far maco y
St at us como v ar i abl es ex pl i cat i v as.
Result ados descr ipt ivos.
Anova Dos Factores. Estadísticos
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): STATUS, FARMACO
Número de Casos: 40
Desviación
STATUS N Media Mediana Típica Mínimo Máximo
--------------------------------------------------------------------
3 12 56.1667 53.0000 10.5644 42.0000 74.0000
2 11 68.4545 69.0000 7.8913 60.0000 82.0000
1 17 61.3529 59.0000 11.1183 42.0000 82.0000
--------------------------------------------------------------------
Total 40 61.7500 61.0000 10.9772 42.0000 82.0000
196
Desviación
FARMACO N Media Mediana Típica Mínimo Máximo
--------------------------------------------------------------------
2 20 62.3500 62.0000 9.6206 44.0000 78.0000
1 20 61.1500 59.5000 12.4108 42.0000 82.0000
----------------------------------------------------------------------
Total 40 61.7500 61.0000 10.9772 42.0000 82.0000
----------------------------------------------------------------------
STATUS Desviación
FARMACO N Media Mediana Típica Mínimo Máximo
---------------------------------------------------------------------
2,2 6 66.8333 65.5000 7.3869 60.0000 78.0000
2,1 5 70.4000 70.0000 8.8769 60.0000 82.0000
1,2 8 62.2500 62.0000 9.7651 48.0000 76.0000
1,1 9 60.5556 59.0000 12.7388 42.0000 82.0000
3,2 6 58.0000 58.0000 10.8074 44.0000 74.0000
3,1 6 54.3333 52.0000 10.9848 42.0000 74.0000
---------------------------------------------------------------------
Total 40 61.7500 61.0000 10.9772 42.0000 82.0000
---------------------------------------------------------------------
Result ados del Anova con int er acción.
Anova Dos Factores
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): STATUS, FARMACO
Número de Casos: 40
Anova
----------------------------------------------------------------------
Suma de Cuadrado
Cuadrados G.L. Medio F-valor p-valor
----------------------------------------------------------------------
STATUS 871.2237 2 435.6119 3.9590 0.0285
FARMACO 7.1657 1 7.1657 0.0651 0.8001
STATUS*FARMACO 80.0217 2 40.0108 0.3636 0.6978
Residual 3741.0889 34 110.0320
----------------------------------------------------------------------
Total (corr.) 4699.5000 39
Manual G- St at 2. 0 197
Medias e I C con los er r or es est ándar de los subgr upos sin int er acción.
Anova Dos Factores, Medias e I.C.
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): STATUS, FARMACO
Número de Casos: 40
Tabla de Medias con Intervalos Errores Estándar
----------------------------------------------------------
Límite Límite
n Media E.E. Inferior Superior
----------------------------------------------------------
Total 40 61.9868
STATUS
1 17 61.3779 2.5006 58.8773 63.8785
2 11 68.4160 3.1099 65.3061 71.5259
3 12 56.1667 2.9741 53.1926 59.1407
FARMACO
1 20 61.5628 2.3387 59.2241 63.9015
2 20 62.4109 2.3142 60.0967 64.7251
Gr áf ico de medias con I nt er valos er r or es est ándar par a el f act or St at us.
198
Compar aciones múlt iples con la pr ueba de Scheffé en un modelo con
int er acción.
Anova Dos Factores. Comparaciones Múltiples
=====================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): STATUS, FARMACO
Número de Casos: 40
Modelo con Interacción
con I.C. Scheffé al 95.0%
--------------------------------------
Grupos
STATUS n Media Homogéneos
--------------------------------------
3 12 56.1667 X
1 17 61.4028 XX
2 11 68.6167 X
--------------------------------------
Contraste Diferencia +/- Límite
--------------------------------------
1 VS 2 -7.2139 10.4229
1 VS 3 5.2361 10.1306
2 VS 3 *12.4500 *11.2320
--------------------------------------
* Diferencia estadísticamente significativa.
Gráfico de medias con indicación de las int eracciones.
Manual G- St at 2. 0 199
Anova Fact or i al ( abc| y)
Realiza la pr ueba Anova fact or ial par a t r es fact or es con y sin int er acciones
dobles y t r iples. Asimismo, facilit a, ent r e ot r as t écnicas asociadas a ella, las
comparaciones múlt iples a post eriori.
El Análisis de la Var ianza Fact or ial ( t r es fact or es) se basa en descomponer la
variabilidad t ot al SCT en cuat ro component es: para el primer fact or SCA, para
el segundo fact or SCB, par a el t er cer fact or SCC y un cuar t o con or igen
desconocido SCR.
Se denot a por y al vect or con los valor es de la var iable r espuest a, con X
a
a la
mat riz de n filas por ( 1+ r
a
- 1) columnas con la pr imer a columna t odo de unos y
las rest ant es ( r
a
- 1) columnas, las asociadas a las var iables dummy de la
pr imer a var iable explicat iva con r
a
ni vel es, con X
ab
a l a mat r i z de n f i l as por
(1+ r
a
-1+ r
b
- 1) columnas r esult ant e de añadir ( r
b
- 1) columnas a la mat riz
ant erior X
a
, asociadas a las var iables dummy de la segunda var iable explicat iva
con r
b
niveles, con X a la mat riz de n filas por ( 1+ r
a
-1+ r
b
-1+ r
c
- 1) col umnas
result ant e de añadir ( r
c
- 1) col umnas a l a mat r i z ant er i or X
ab
, asociadas a las
variables dummy de la t ercera variable explicat iva con r
c
ni vel es.
Se t iene que las expresiones para SCT ( suma de cuadrados t ot al) , SCA ( suma
de cuadrados de la primera variable explicat iva) , SCB ( suma de cuadrados de
la segunda variable explicat iva) , SCC ( suma de cuadrados de la t ercera
variable explicat iva) , SCR ( suma de cuadrados residual) , GLT ( grados de
libert ad t ot al) , GLA ( grados de libert ad de la primera variable explicat iva) , GLB
( gr ados de liber t ad de la segunda var iable explicat iva) , GLC ( gr ados de liber t ad
de la t ercera variable explicat iva) , GLR ( grados de libert ad residual) , CMA
( cuadr ado medio de la pr imer a var iable explicat iva) , CMB ( cuadr ado medio de
la segunda variable explicat iva) , CMC ( cuadrado medio de la t ercera variable
explicat iva) , CMR ( cuadrado medio residual) , F
a
( est adíst ico de cont rast e para
la pr imer a var iable explicat iva) , F
b
( est adíst ico de cont rast e para la segunda
var i abl e expl i cat i va) y F
c
( est adíst ico de cont rast e para la t ercera variable
explicat iva) son:
( ) ( ) y y y y SCT
t
− − ·
( ) ( )
a a
t
a a
b X y b X y SCT SCA − − − · , ( ) y X X X b
t
a
1
a
t
a a

·
( ) ( )
ab ab
t
ab ab
b X y b X y SCA SCT SCB − − − − · , ( ) y X X X b
t
ab
1
ab
t
ab ab

·
( ) ( ) Xb y Xb y SCR
t
− − · , ( ) y X X X b
t
1
t

·
200
SCR SCB SCA SCT SCC − − − ·
1 n GLT − · , 1 r GLA
a
− · , 1 r GLB
b
− · , 1 r GLC
c
− ·
GLC GLB GLA GLT GLR − − − ·
GLA
SCA
CMA · ,
GLB
SCB
CMB · ,
GLC
SCC
CMC · ,
GLR
SCR
CMR ·
CMR
CMA
F
a
· ,
CMR
CMB
F
b
· ,
CMR
CMC
F
c
·
El est adíst ico de cont r ast e F
a
sigue una dist ribución F de Snedecor con grados
de libert ad del numerador GLA y grados de libert ad del denominador GLR. El
est adíst i co F
b
sigue una dist r ibución F de Snedecor con gr ados de liber t ad del
numer ador GLB y gr ados de liber t ad del denominador GLR. El est adíst ico F
c
sigue una dist ribución F de Snedecor con grados de libert ad del numerador GLC
y grados de libert ad del denominador GLR. Para cada fact or, la hipót esis nula
de i gual dad de medi as se r echaza en el caso en el que su F t enga un p-
valor < 0. 05, en caso cont r ar io no hay evidencia suficient e par a poder
rechazarla. En el caso de que se rechace la hipót esis nula de igualdad de
medias se puede det er minar mediant e compar aciones múlt iples a post er ior i, de
qué gr upo o gr upos pr ovienen esas difer encias.
Se incluye t ambién la posibilidad de cont emplar las int eracciones ent re dos
fact or es o incluso ent r e los t r es fact or es, que a efect os comput acionales son
como un nuevo fact or que se cr ea a par t ir de la combinación de los niveles de
los dos o t r es f act or es.
Medi as e I C
En la t abla cor r espondient e se muest r an par a cada uno de los gr upos, las
medias de la variable cuant it at iva, j unt o con su error est ándar y sus int ervalos
confidenciales calculados según dist int os mét odos. Est os int ervalos
confidenciales se pueden represent ar gráficament e con la pest aña “ Gráfico de
Medi as” .
En la pant alla de opciones se selecciona el mét odo que se desee par a el
cálculo de los int er valos de las medias. Exist en las siguient es posibilidades:
ninguno, errores est ándar, int ervalos de confianza, int ervalos LSD, int ervalos
HSD, int er valos Scheffé, int er valos Bonfer r oni. Las fór mulas son análogas a las
dadas en Anova / Anova / Medias e I C, aunque el cálculo de los er r or es
est ándar viene dado por
( )
t
1
t
l X X l CMR ⋅ ⋅ ⋅

Manual G- St at 2. 0 201
donde l es un vect or para cada posible media con ( 1+ ( r
a
- 1) + ( r
b
- 1) + ( r
c
- 1) )
coordenadas, donde la primera component e es uno, las component es relat ivas
a cada var iable explicat iva es 1 en la cor r espondient e var iable dummy y cer o
en caso cont rario, y las component es relat ivas a las ot ras variables explicat ivas
son el inver so del númer o de cat egor ías de la cor r espondient e var iable
explicat iva.
Por ej emplo, si la pr imer a var iable explicat iva t iene t r es cat egor ías, la segunda
variable explicat iva t iene dos cat egorías y la t ercera variable explicat iva t iene
dos cat egor ías, par a la pr imer a cat egor ía de la pr imer a var iable explicat iva el
vect or l es ( 1, 1, 0, 1/ 2, 1/ 2) , para la segunda cat egoría de la primera variable
explicat iva el vect or l es ( 1, 0, 1, 1/ 2, 1/ 2) , para la t ercera cat egoría de la
primera variable explicat iva es ( 1, 0, 0, 1/ 2, 1/ 2) , para la primera cat egoría de
la segunda var iable explicat iva el vect or l es ( 1, 1/ 3, 1/ 3, 1, 1/ 2) , par a la
segunda cat egor ía de la segunda var iable explicat iva el vect or l es ( 1, 1/ 3, 1/ 3,
0, 1/ 2) , par a la pr imer a cat egor ía de la t er cer a var iable explicat iva el vect or l
es ( 1, 1/ 3, 1/ 3, 1/ 2, 1) y para la segunda cat egoría de la t ercera variable
explicat iva el vect or l es ( 1, 1/ 3, 1/ 3, 1/ 2, 0) .
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y las t res
Variables explicat ivas cualit at ivas que forman los grupos. La variable
r espuest a no puede ser const ant e. Las var iables explicat ivas deben
t ener dos o más gr upos.
Est adíst i cos: Est adíst icos de la variable respuest a para cada cat egoría
de las variables explicat ivas y sus combinaciones. Se det allan en
Cuant it at iva ( y) .
Di sper si ón: Se muest r an los dat os de los casos par a la var iable
r espuest a según las cat egor ías de cada var iable explicat iva o fact or .
Así, par a cada uno de los niveles del fact or , que apar ecen en el ej e X,
pueden verse los valores de la variable respuest a observados. Est e
gr áfico per mit e t ener una apr oximación visual de cuál es el efect o del
fact or sobr e la var iable r espuest a r espect o de su media y de su
disper sión.
Opciones:
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
202
Anova: Result ados del Análisis de la Var ianza de dos fact or es par a la
compar ación de medias de los dist int os gr upos.
Opciones:
- I ncluir o no los t ér minos de int er acción doble o t r iple en el
modelo. Si se señala el análisis de la int er acción t r iple, t ambién
se incluir án las dobles.
Opciones de Anova en Anova Fact or ial.
Medi as e I C: En est a t abla se muest r an par a cada uno de los gr upos
de los t r es fact or es , las medias de la var iable r espuest a, j unt o con su
er r or est ándar y sus int er valos de confianza calculados según dist int os
mét odos. Est os int er valos de confianza se pueden r epr esent ar
gr áficament e con la pest aña “ Gr áfico de Medias” .
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- I ncluir o no los t ér minos de int er acción doble o t r iple en el
modelo. Si se señala el análisis de la int er acción t r iple, t ambién
se incluir án las dobles.
Gr áf i co de Medi as: Se muest r an par a cada uno de los gr upos de los
t res fact ores, las medias de la variable respuest a, j unt o con sus
int er valos de confianza calculados según dist int os mét odos.
Manual G- St at 2. 0 203
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- La cabecera, el t ít ulo del ej e X y del ej e Y, el mínimo, máximo
e increment o del ej e Y.
- I ncluir o no los t ér minos de int er acción doble o t r iple en el
modelo. Si se señala el análisis de la int er acción t r iple, t ambién
se incluir án las dobles.
Compar aci ones Múl t i pl es: Result ados de las pr uebas a post er ior i
par a det er minar de qué gr upo o gr upos de los t r es f act or es pr ovienen
las difer encias det ect adas en el Anova. Est e pr ogr ama se basa en los
r esult ados de las compar aciones dos a dos obt enidas. Mediant e un
ast er isco se señalan los gr upos que son difer ent es y mediant e un aspa
se agr upan los gr upos homogéneos o semej ant es.
Opciones:
- Mét odo: Ver opción Anova un Fact or .
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- I ncluir o no los t ér minos de int er acción doble o t r iple en el
modelo. Si se señala el análisis de la int er acción t r iple, t ambién
se incluir án las dobles.
Gr áf i co I nt er acci ones: El obj et ivo de est e gr áf ico es det ect ar la
posible int er acción ent r e los fact or es, que se pr esent a en el caso de
que en el gr áfico no haya par alelismo ent r e las r ect as. En caso de que
haya int eracción, la int erpret ación de la influencia de los fact ores no es
direct a. La propia combinación de los efect os de cada uno de los
fact or es que for man par t e del est udio, puede ser el r esult ado de la
variabilidad de la variable respuest a, lo que se conoce como
int eracción. Gráficament e la int eracción de fact ores se reflej a mediant e
la ausencia de par alelismo de las r ect as que unen las medias.
204
: Real i zar l a pr ueba Anov a Fact or i al de l a v ar i abl e FC2FC1 con
Far maco, Fumador y St at us como v ar i abl es ex pl i cat i v as.
Variables en la opción Anova Fact orial.
Est adíst icos de la opción Anova Fact orial ( sólo se muest ran una int eracción
doble y la t riple) .
Anova Factorial. Estadísticos
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): FARMACO, FUMADOR, STATUS
Número de Casos: 40
. . . . . . . . .
FUMADOR Desviación
STATUS N Media Mediana Típica Mínimo Máximo
----------------------------------------------------------------------
2,3 9 54.4444 52.0000 10.3816 42.0000 74.0000
2,2 6 67.3333 65.0000 8.4538 60.0000 78.0000
2,1 9 60.7778 58.0000 10.6040 46.0000 82.0000
1,3 3 61.3333 58.0000 11.3725 52.0000 74.0000
1,2 5 69.8000 69.0000 7.8867 62.0000 82.0000
1,1 8 62.0000 67.0000 12.3751 42.0000 76.0000
----------------------------------------------------------------------
Total 40 61.7500 61.0000 10.9772 42.0000 82.0000
----------------------------------------------------------------------
Manual G- St at 2. 0 205
FARMACO
FUMADOR Desviación
STATUS N Media Mediana Típica Mínimo Máximo
----------------------------------------------------------------------
2,1,2 3 67.6667 69.0000 5.1316 62.0000 72.0000
2,1,1 4 65.0000 68.0000 12.0554 48.0000 76.0000
1,1,3 3 61.3333 58.0000 11.3725 52.0000 74.0000
1,1,2 2 73.0000 73.0000 12.7279 64.0000 82.0000
1,1,1 4 59.0000 61.0000 13.7113 42.0000 72.0000
2,2,3 6 58.0000 58.0000 10.8074 44.0000 74.0000
2,2,2 3 66.0000 60.0000 10.3923 60.0000 78.0000
1,2,3 3 47.3333 48.0000 5.0332 42.0000 52.0000
2,2,1 4 59.5000 58.0000 7.5498 52.0000 70.0000
1,2,2 3 68.6667 70.0000 8.0829 60.0000 76.0000
1,2,1 5 61.8000 59.0000 13.3866 46.0000 82.0000
----------------------------------------------------------------------
Total 40 61.7500 61.0000 10.9772 42.0000 82.0000
----------------------------------------------------------------------
Tabla del Anova Fact or ial con int er acciones dobles.
Anova Factorial
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): FARMACO, FUMADOR, STATUS
Número de Casos: 40
Anova
--------------------------------------------------------------------
Suma de Cuadrado
Cuadrados G.L. Medio F-valor p-valor
--------------------------------------------------------------------
FARMACO 14.4000 1 14.4000 0.1274 0.7237
FUMADOR 187.4568 1 187.4568 1.6581 0.2077
STATUS 764.0682 2 382.0341 3.3793 0.0475
INTERACCIONES
A*B 5.4190 1 5.4190 0.0479 0.8282
A*C 120.2221 2 60.1110 0.5317 0.5930
B*C 216.3783 2 108.1891 0.9570 0.3955
Residual 3391.5556 30 113.0519
--------------------------------------------------------------------
Total (corr.) 4699.5000 39
206
Comparaciones múlt iples por Bonferroni de la opción Anova fact orial con
int eracciones dobles para la variable St at us.
Anova Factorial. Comparaciones Múltiples
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): FARMACO, FUMADOR, STATUS
Número de Casos: 40
Modelo con interacciones 2 niveles
con I.C. Bonferroni al 95.0%
--------------------------------------
Grupos
STATUS n Media Homogéneos
--------------------------------------
3 12 60.6786 X
1 17 61.3810 X
2 11 68.6468 X
--------------------------------------
Contraste Diferencia +/- Límite
--------------------------------------
1 VS 2 -7.2659 10.5089
1 VS 3 0.7024 12.7744
2 VS 3 7.9683 13.8128
--------------------------------------
* Diferencia estadísticamente significativa.
I nt er acciones de la opción Anova fact or ial par a Far maco por St at us.
Manual G- St at 2. 0 207
Menú Mul t i var i ant e
Act ivar la opción Mul t i var i ant e del menú principal o mediant e Alt + M. Est e
menú cont iene las opciones necesarias para realizar dist int as regresiones
mult ivariant es. En Regresión Múlt iple se t iene que varias variables explicat ivas
cuant it at ivas ( xz) int ent an explicar una variable respuest a cuant it at iva ( y) . En
Regresión Logíst ica se t iene que varias variables explicat ivas cuant it at ivas ( xz)
int ent an explicar una variable respuest a dicot ómica o binaria ( b) . En Regresión
de Cox se t iene que var ias var iables explicat ivas cuant it at ivas ( xz) int ent an
explicar una var iable r espuest a censur ada ( y cens) . En las t r es r egr esiones si
se desea ut ilizar variables explicat ivas cualit at ivas de k cat egorías, es necesario
generar previament e k- 1 variables fict icias y asignarles los códigos binarios
cor r espondient es. Todas las var iables explicat ivas han de ser numér icas,
inclusive las de nat ur aleza dicot ómica.
La forma de generación de k- 1 variables fict icias a part ir de una variable
cualit at iva con k cat egor ías es la siguient e:
Variable Cualit at iva Fict icia 1 Fict icia 2 … Fict icia k- 1
Cat egoría 1 0 0 … 0
Cat egoría 2 1 0 … 0
Cat egoría 3 0 1 … 0
… … … … …
Cat egor ía k 0 0 … 1
Est e paso no es aut omát ico en G- St at . La f or ma de pr oceder es la siguient e:
insert ar k- 1 variables con sus nombres correspondient es, copiar ( mediant e
CTRL+ C y CTRL+ V) k- 1 veces la var iable cualit at iva que se quier e t r ansfor mar
en “ dummy” en las var iables inser t adas y r ecodificar dichas var iables según el
esquema de la t abla ant er ior .
Par a el est udio de las int er acciones ent r e var iables explicat ivas hay que cr ear
previament e las variables de int eracción como product o arit mét ico de dichas
208
variables mediant e el menú de Ut ilidades / Transformación. Post eriorment e se
t r at an como una var iable explicat iva más.
Regr esi ón Múl t i pl e ( x z| y)
Realiza la regresión lineal múlt iple que modeliza una variable respuest a
cuant it at iva a part ir de varias variables explicat ivas cuant it at ivas.
El model o que se asume par a descr i bi r l a r el aci ón ent r e el conj unt o de r
variables explicat ivas y la variable respuest a y es
ε + β · X y
donde y es un vect or de dimensiones n por 1, X es una mat r iz de dimensiones
n por ( 1+ r ) con la pr imer a columna igual a uno, β es el vect or de par ámet r os
del modelo de dimensiones ( r+ 1) por 1 y ε es el vect or de r esiduos de
dimensiones n por 1.
El vect or de par ámet r os β se est ima por el vect or de coef icient es b a t r avés del
mét odo de mínimos cuadr ados
( ) y X X X b
t
1
t

·
A part ir del modelo se calculan los valores predichos mediant e
Xb yˆ ·
por lo que los r esiduos est imados son
Xb y yˆ y ˆ e − · − · ε ·
Mediant e el vect or de r esiduos est imados se calcula la desviación t ípica
est imada de los residuos s con
( ) 1 r n
ˆ ˆ
s
t
+ −
ε ε
·
El vect or de er r or es est ándar de los coef icient es b se est ima a t r avés de la r aíz
cuadr ada de los element os de la diagonal pr incipal de la mat r iz Cov( b) de
var ianzas- covar ianzas de b dada por
( )
1
t 2
X X s ) b ( Cov

·
Manual G- St at 2. 0 209
La signif icación de cada var iable se lee en cada uno de los p- valor es asociados
a cada coeficient e, y se calcula a t ravés del est adíst ico t que result a de dividir
el coeficient e ent r e su er r or est ándar .
La t abla del Anova muest r a mediant e la F del Modelo si el modelo aj ust a a los
dat os. En dicha t abla int ervienen SCT ( suma de cuadrados t ot al) , SCM ( suma
de cuadrados del modelo) , SCR ( suma de cuadrados residual) , GLT ( grados de
libert ad t ot al) , GLM ( grados de libert ad del modelo) , GLR ( grados de libert ad de
los residuos) , CMM ( cuadrado medio del modelo) , CMR ( cuadrado medio
r esidual) , F del modelo y p del modelo, que se calculan de la for ma siguient e:
2
t
y n y y SCT − ·
2
t
yˆ n yˆ yˆ SCM − ·
SCM SCT ˆ ˆ SCR
t
− · ε ε ·
1 n GLT − · , r GLM · , GLM GLT ) 1 r ( n GLR − · + − ·
GLM
SCM
CMM · ,
GLR
SCR
CMR ·
CMR
CMM
F ·
que sigue una dist r ibución F de Snedecor con gr ados de liber t ad del numer ador
GLM y grados de libert ad del denominador GLR.
El coeficient e R
2
de det erminación suminist ra el porcent aj e de información de la
var iable r espuest a explicado por el modelo mediant e
SCT
SCM
R
2
·
Un aj ust e de R
2
t eniendo en cuent a el númer o de var iables, ya que a mayor
número de variables se corresponde mayor R
2
, es
( )
GLR
GLT
R 1 1 aj ust ado R
2 2
− − ·
El coeficient e de var iación se calcula mediant e la expr esión
y
s
100 ⋅
La det ección de cor r elación en los r esiduales la da el est adíst ico de Dur bin-
Wat son mediant e la expr esión
210
( )
∑ ε
∑ ε − ε
·
·

n
1 j
2
j
n
2 j
2
1 j j
ˆ
ˆ ˆ
Coef i ci ent es e I C
Para cada coeficient e b
j
del vect or b se calcula su int er valo confidencial como
[ ]
j ) 1 r ( n ; 2 / 1 j
b EE t b ⋅ t
+ − α −
El coeficient e Fact or I ncrement o de la Varianza FI V ( “ Variance I nflat ion Fact or”
= VI F) permit e det ect ar la presencia de mult icolinealidad y se calcula como
2
j
j
R 1
1
VI F

·
siendo
2
j
R el coeficient e de det er minación múlt iple en una r egr esión con
variable respuest a la variable x
j
y var iables explicat ivas el r est o de var iables x.
Por t ant o, la mult icolinealidad se da cuando las correlaciones ent re variables
independient es son elevadas, lo cual no es convenient e por que la est imación
del modelo puede no ser posible.
Pr edi cci ones
Se muest ran los residuos, los residuos est udent izados y las predicciones. Los
r esiduos vienen dados por e, con
Xb y yˆ y ˆ e − · − · ε ·
Los residuos est udent izados calculan los residuos “ j acknife” r
( - i)
mediant e
( )
i
2
) i (
i
) i (
h 1 s
e
r
− ⋅
·


donde s
( - i)
es la desviación t ípica est imada de los r esiduos cuando se supr ime la
observación del individuo i y h
i
es el element o i de la diagonal de la mat r iz H de
dimensiones n por n dada por
( )
t
1
t
X X X X H

·
La mat r iz H r ecibe el nombr e de “ hat mat r ix” ya que
Hy yˆ ·
Manual G- St at 2. 0 211
Los residuos “ j acknife” pueden requerir elevados recursos comput acionales
par a f i cher os de más de 1000 casos.
Par a las pr edicciones de valor es individuales se ut iliza
i ) 1 r ( n ; 2 / 1 i
h
npr ed
1
s t Pr ed + ⋅ t
+ − α −
siendo npr ed el númer o usado par a las pr edicciones.
Par a las pr edicciones de valor es medios se ut iliza
i ) 1 r ( n ; 2 / 1 i
h s t Pr ed ⋅ t
+ − α −
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva y la( s)
Variable( s) explicat iva( s) cuant it at ivas. Las var iables no deben t ener
var ianza cer o.
Est adíst i cos: Est adíst icos de t odas las variables seleccionadas. Se
det allan en Cuant it at iva ( y) . Sólo se t ienen en cuent a los regist ros
complet os para t odas las variables analizadas.
Cor r el aci ones: Se muest r an los coef icient es de cor r elación de Pear son
y de Spear man par a cada par de var iables. La significación dada por el
p- valor ( ent r e par ént esis) est á cont r ast ando la hipót esis nula de que el
coeficient e de correlación poblacional es cero.
Model o: Se muest r a la ecuación del modelo, la t abla del Anova, el
coeficient e R
2
y el est adíst ico de Dur bin- Wat son, ent r e ot r os.
Opci ones:
- Si se quier e incluir o no el t ér mino const ant e.
- Selección de var iables: incluir t odas, aplicar un pr ocedimient o
paso a paso hacia adelant e o hacia det r ás.
- Nivel de signif icación p par a ent r ar y par a salir en el pr oceso
secuencial de selección del modelo: las var iables van ent r ando
en el modelo si r ealment e lo mej or an más allá de lo que podr ía
deber se al azar ( p- par a- ent r ar ) y pueden salir si no mej or an el
modelo significat ivament e ( con relación a p- para- salir) .
212
- Nivel de confianza: Por defect o es 95%, per o t ambién son
habit uales 90% y 99%. El nivel de conf ianza debe ser > 0 y
< 100.
- Númer o máximo de it er aciones que se per mit e.
Por defect o, el programa t iene marcadas las opciones: incluido
el t érmino const ant e, incluidas t odas las variables, p- para-
ent r ar y p- par a- salir con valor 0. 1 y el númer o máximo de
it er aciones es 20.
Aunque el algor it mo ut ilizado es r obust o en la mayor ía de sit uaciones,
no se asegur a la conver gencia en t odos los casos.
Coef i ci ent es e I C: Se muest r an par a cada coeficient e de la r egr esión
múlt iple su error est ándar, su int ervalo de confianza y su coeficient e
Fact or I ncr ement o de la Var ianza ( FI V) . El nivel de confianza se puede
modif icar en la vent ana de opciones. En las opciones el valor por
defect o es 95%. El nivel de confianza debe ser > 0 y < 100. En opciones
se debe r edefinir el modelo t al y como se definió en la pest aña Modelo.
Las vent anas de opciones no est án conect adas ent r e vent anas, por lo
que cualquier cambio en una pest aña debe realizarse nuevament e en
las demás si se desean r esult ados coher ent es.
Pr edi cci ones: Se present an predicciones e int ervalos de confianza
par t ir de las var iables explicat ivas. En opciones se debe r edefinir el
modelo t al y como se def inió en la pest aña Modelo.
Manual G- St at 2. 0 213
: Se desea model i zar medi ant e r egr esi ón l i neal múl t i pl e l a v ar i abl e
FC2FC1 en f unci ón de l as v ar i abl es Edad y FC1.
Result ados de la mat r iz de cor r elaciones de Pear son y su signif icación.
Regresión Múltiple. Correlaciones
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): EDAD, FC1
Número de Casos: 40
r de Pearson
(Significación)
FC2FC1 EDAD FC1
---------------------------------------------
FC2FC1 1.0000 -0.9393 -0.1676
(0.0001) (0.3012)
EDAD -0.9393 1.0000 0.1848
(0.0001) (0.2537)
FC1 -0.1676 0.1848 1.0000
(0.3012) (0.2537)
----------------------------------------------------------------------
Result ados del modelo, incluyendo t odas las variables, con la significación de
los coef icient es.
Regresión Lineal Múltiple. Modelo
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): EDAD, FC1
Número de Casos: 40
---------------------------------------------------------
Coef. E.E. t-valor p-valor
---------------------------------------------------------
CONSTANTE 222.1198 10.1887 21.8005 0.0001E-18
EDAD -7.1784 0.4382 -16.3821 0.0002E-14
FC1 0.0070 0.0661 0.1064 0.9158
---------------------------------------------------------
214
Anova
---------------------------------------------------------------
Suma de Cuadrado
Variabilidad Cuadrados G.L. Medio F-valor p-valor
--------------------------------------------------------------------
Modelo 4146.0952 2 2073.0476 138.6015 0.0007E-14
Residual 553.4048 37 14.9569
--------------------------------------------------------------------
Total (corr.) 4699.5000 39
--------------------------------------------------------------------
Total (corr.) 4699.5000 39
r cuadrado (coficiente de determinación) 88.2242 %
r cuadrado (ajustado) 87.5876 %
Desviación Típica de los Residuos 3.8674
Coeficiente de variación 6.2630 %
Error Absoluto Medio 2.9014
Durbin-Watson 1.5536
I nt ervalos de confianza de los coeficient es y valores FI V.
Regresión Lineal Múltiple. Coeficientes e I.C.
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): EDAD, FC1
Número de Casos: 40
Coeficientes e I.C. al 95.00%
----------------------------------------------------------------------
Factor
Límite Límite Incremento
Coef. E.E. Inferior Superior Varianza (FIV)
----------------------------------------------------------------------
CONSTANTE 222.1198 10.1887 201.4756 242.7640
EDAD -7.1784 0.4382 -8.0662 -6.2906 1.0353
FC1 0.0070 0.0661 -0.1268 0.1409 1.0353
----------------------------------------------------------------------
Est imados y análisis de r esiduales de algunos casos.
Regresión Lineal Múltiple. Predicciones
======================================================================
Variable Respuesta: FC2FC1
Variable(s) Explicativa(s): EDAD, FC1
Número de Casos: 40
Manual G- St at 2. 0 215
----------------------------------------------------------------------
Valor Valor Límite Conf. Límite Conf.
Observado Predicho Residuo Inferior 95.00 Superior 95.00
----------------------------------------------------------------------
59.0000 60.5629 -1.5629 57.6299 63.4960
76.0000 79.1002 -3.1002 76.5655 81.6350
72.0000 67.6007 4.3993 66.1653 69.0362
70.0000 68.9380 1.0620 66.6549 71.2211
46.0000 46.8115 -0.8115 44.6013 49.0217
66.0000 63.9412 2.0588 62.1386 65.7439
68.0000 61.2245 6.7755 59.2003 63.2488
. . . . .
Regr esi ón Logíst i ca ( x z| b)
Realiza la regresión logíst ica que modeliza una variable respuest a dicot ómica o
binaria ( relacionada con la ocurrencia de un suceso) a part ir de varias variables
explicat ivas cuant it at ivas. Conviene codificar la var iable r espuest a Y con unos y
ceros, de forma que el código uno se asocie al suceso de int erés. El modelo de
r egr esión logíst ica par a p var iables explicat ivas x
1
, x
2
, …, x
p
es el si gui ent e:
( )
( ) ( )
p p 1 1 0
i
x b ... x b b exp 1
1
1 y Pr ob
+ + + − +
· · ,
donde b
j
est á asociado a la var iable explicat iva j - ésima y b
0
es un coeficient e
que no est á asignado a ninguna var iable, t ambién llamado const ant e o
“ int er cept a” .
Est os coeficient es se det erminan maximizando la función de verosimilit ud de la
muest ra. El procedimient o de maximización se realiza por el mét odo it erat ivo
de Newt on- Raphson, disminuyendo en cada it er ación el “ –2Log Likelihood” ,
hast a alcanzar su valor mínimo en el modelo final. Est e mét odo además de
proporcionar los coeficient es del modelo, t ambién facilit a sus errores est ándar.
A par t ir de los coeficient es b
i
y de los errores est ándar EE( b
i
) se const r uye el
est adíst ico de cont r ast e de Wald con
2
j
j
j
) b ( EE
b
Wal d

,
`

.
|
·
que sigue una Chi- Cuadr ado con 1 gr ado de liber t ad.
El coeficient e de correlación parcial R se calcula como
216
) 0 ( LL 2
2 Wal d
R
j


·
donde –2LL( 0) es menos dos veces el logar it mo neper iano de la función de
ver osimilit ud en el paso inicial ( paso cer o) . El signo de R es el signo del
coef icient e. Si Wald es menor que dos, se consider a R igual a cer o.
El cont r ast e de aj ust e del modelo ( Difer encia de Likelihood) cont r ast a si el
decr ement o en el “ –2Log Likelihood” ent r e el modelo nulo ( sin incluir ninguna
var iable explicat iva) y el modelo final es significat ivo, siendo el númer o de
gr ados de liber t ad del est adíst ico de cont r ast e el númer o de var iables
explicat ivas) . No r echazar la hipót esis nula equivale a acept ar que
conj unt ament e las var iables explicat ivas no son r elevant es en el modelo ( sus
coeficient es son t odos nulos) .
La medida de efect o de cada var iable se calcula a t r avés del Odds Rat io que
viene dado por la exponencial del coeficient e. Los int er valos de confianza del
95% de cada Odds Rat io vienen dados por
( ) ( ) ( ) ( ) ( )
j j j j
b EE 96 . 1 b exp , b EE 96 . 1 b exp + −
Un OR significat ivament e mayor que uno indica que un increment o en la
var iable explicat iva se asocia a un incr ement o en el Odds de la var iable
r espuest a. I gualment e, un OR significat ivament e menor que uno indica que un
incr ement o en la var iable explicat iva se asocia a un decr ement o en el Odds de
la var iable r espuest a. El OR se consider ar á significat ivament e difer ent e de 1 si
es significat ivament e dist int o de cer o el coeficient e cor r espondient e en el
modelo
Par a r ealizar la t abla de clasificación, se calcula par a cada individuo i la
pr obabilidad est imada de ocur r encia que viene dada por
( ) ( )
pi p i 1 1 0
i
x b ... x b b exp 1
1
Pr ob
+ + + − +
·
Si Pr ob
i
> = Punt o de cor t e que def ine el usuar io ent onces se pr edice " el valor
que se est é modelizando en la vent ana de opciones del modelo" , en caso
cont r ar io se pr edice " el valor que no se est é modelizando " . La t abla de
clasificación result a de cruzar la variable respuest a observada con la predicha.
El porcent aj e de casos correct ament e pronost icados puede ent enderse como un
est imador de la calidad de aj ust e del modelo, aunque ést e siempre est ará
sesgado hacia valor es alt os debido a que los mismos casos que han per mit ido
est imar el modelo son los que se est án pr onost icando.
Manual G- St at 2. 0 217
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a dicot ómica o binar ia ( b)
y la( s) Variable( s) explicat iva( s) cuant it at ivas. Las var iables no deben
t ener var ianza cer o.
Est adíst i cos: Est adíst icos de las var iables explicat ivas par a cada nivel
de la var iable r espuest a. Se det allan en Cuant it at iva ( y) . Sólo se t ienen
en cuent a los r egist r os complet os par a t odas las var iables analizadas.
Model o: Se muest r a el pr oceso it er at ivo de disminución del est adíst ico
“ - 2Log Likelihood” , la ecuación del modelo, los “ Odds rat io” y la t abla
de clasif icación.
Opci ones:
- Si se quier e incluir o no el t ér mino const ant e.
- Código de ocur r encia que se quier e modelizar de la var iable
r espuest a dicot ómica.
- Selección de var iables: incluir t odas, aplicar un pr ocedimient o
paso a paso hacia adelant e o hacia det r ás.
- Valor del punt o de cort e que se ut ilizará para generar la t abla
de clasif icación que pr opor ciona el modelo.
- Nivel de signif icación p par a ent r ar y par a salir en el pr oceso
secuencial de selección del modelo: las var iables van ent r ando
en el modelo si r ealment e lo mej or an más allá de lo que podr ía
deber se al azar ( p- par a- ent r ar ) y pueden salir si no mej or an el
modelo significat ivament e ( con relación a p- para- salir) .
- Valor alfa par a const r uir los int er valos de confianza par a el OR
asociado a cada variable explicat iva del modelo. En las
opciones el valor por def ect o de alf a es 5% que cor r esponde a
un I C del 95%. Alfa debe ser > 0 y < 100.
- Númer o máximo de it er aciones que se per mit e.
Por defect o, el programa t iene marcadas las opciones: incluido
el t érmino const ant e, código de ocurrencia igual al primer valor
en el f icher o de dat os par a la var iable r espuest a, incluidas
t odas las var iables, punt o de cor t e 0. 5, p- par a- ent r ar y p- par a-
salir con valor 0. 1, alfa de un 5% y el númer o máximo de
it er aciones es 20.
218
En pr esencia de separ ación o cuasisepar ación los est imador es de
máxima ver osimilit ud no exist en. No obst ant e, se pr esent an los
r esult ados que se deducen de la últ ima it er ación. En est os casos la
validez del modelo es cuest ionable.
Aunque el algor it mo ut ilizado es r obust o en la mayor ía de sit uaciones,
no se asegur a la conver gencia en t odos los casos.
Menú de opciones de la r egr esión logíst ica en Modelo.
Pr edi cci ones: Par a cada caso se pr esent an la pr edicción por el modelo
y su residuo. En opciones se debe redefinir el modelo t al y como se
definió en la pest aña Modelo. Las vent anas de opciones no est án
conect adas en t odo el programa, por lo que cualquier cambio en una
pest aña debe r ealizar se nuevament e en las demás si se desean
r esult ados coher ent es.
: Se desea model i zar l a var i abl e Fumador , con códi go de ocur r enci a
i gual a 2, medi ant e l as v ar i abl es Sex o, Edad y FC2FC1.
Est adíst icos en la r egr esión logíst ica.
Regresión Logística. Estadísticos
======================================================================
Variable Respuesta: FUMADOR
Variable(s) Explicativa(s): SEXO, EDAD, FC2FC1
Número de Casos: 40
Manual G- St at 2. 0 219
Variable=SEXO
Desviación
FUMADOR N Media Mediana Típica Mínimo Máximo
-------------------------------------------------------------------
2 24 1.5000 1.5000 0.5108 1.0000 2.0000
1 16 1.3750 1.0000 0.5000 1.0000 2.0000
-------------------------------------------------------------------
Total 40 1.4500 1.0000 0.5038 1.0000 2.0000
Variable=EDAD
Desviación
FUMADOR N Media Mediana Típica Mínimo Máximo
---------------------------------------------------------------------
2 24 22.5833 22.7500 1.3871 19.5000 25.6000
1 16 22.1625 21.9500 1.5209 20.0000 25.4000
---------------------------------------------------------------------
Total 40 22.4150 22.5500 1.4380 19.5000 25.6000
Variable=FC2FC1
Desviación
FUMADOR N Media Mediana Típica Mínimo Máximo
---------------------------------------------------------------------
2 24 60.0417 59.5000 10.8847 42.0000 82.0000
1 16 64.3125 67.0000 10.9527 42.0000 82.0000
---------------------------------------------------------------------
Total 40 61.7500 61.0000 10.9772 42.0000 82.0000
Result ados de la opción Modelo en la r egr esión logíst ica.
Regresión Logística. Modelo
=====================================================================
Variable Respuesta: FUMADOR
Valor modelizado (ocurrencia): FUMADOR = 2
Variable(s) Explicativa(s): SEXO, EDAD, FC2FC1
Número de Casos: 40
Número de Casos con FUMADOR = 2 : 24
Número de Casos con FUMADOR = 1 : 16
El modelo ha convergido satisfactoriamente
Función Logaritmo de la Verosimilitud LL (Log Likelihood)
------------------------------------------------------------
-2 Log Likelihood = 53.8409 (Modelo Nulo)
-2 Log Likelihood = 49.8110
-2 Log Likelihood = 49.7624
-2 Log Likelihood = 49.7623
-2 Log Likelihood = 49.7623 (Modelo Final)
220
Ajuste del Modelo (Diferencia de Likelihood)
-----------------------------------------------------------------
Chi-Cuadrado = 4.0786; G.L. 3; p-valor = 0.2531
R Cuadrado del Modelo:
-------------------------
Cox-Snell = 0.0969
Nagelkerke = 0.1310
Regresión Logística:
---------------------------------------------------------------------
Variable Coef. E.E. Wald G.L. p-valor R
---------------------------------------------------------------------
SEXO 1.0968 0.7826 1.9640 1 0.1611 0.0000
EDAD -0.6149 0.7140 0.7415 1 0.3892 0.0000
FC2FC1 -0.1331 0.0980 1.8448 1 0.1744 0.0000
CONSTANTE 20.8624 21.5571 0.9366 1 0.3332 0.0000
Variable OR IC95.0%inf IC95.0%sup
----------------------------------------------
SEXO 2.9946 0.6459 13.8843
EDAD 0.5407 0.1334 2.1915
FC2FC1 0.8754 0.7225 1.0607
Tabla de Clasificación para FUMADOR (Punto de corte = 0.50))
----------------------------------------------------------
| Predicción | |
Observados | 2 | 1 | % Correcto
----------------------------------------------------------
2 | 19 | 5 | 79.1667 %
1 | 11 | 5 | 31.2500 %
----------------------------------------------------------
| | | 60.0000 %
Índices de Diagnóstico
----------------------------------------
Valor Predictivo Positivo = 0.6333
Valor Predictivo Negativo = 0.5000
Sensibilidad = 0.7917
Especificidad = 0.3125
Indice de Youden = 0.1042
Regr esi ón de Cox ( x z| y cens)
Realiza la regresión de Cox que modeliza una variable respuest a cuant it at iva
censur ada por la der echa en función de una o var ias var iables explicat ivas
cuant it at ivas. Adicionalment e se muest ran las gráficas de las funciones de
super vivencia por el mét odo de Kaplan- Meier .
Manual G- St at 2. 0 221
Kapl an- Mei er
Gráfico de las curvas de supervivencia para cada cat egoría de cada posible
var iable explicat iva cualit at iva mediant e el pr ocedimient o de Kaplan- Meier .
Est as cur vas se int er pr et an como la pr obabilidad de “ sobr evivir ” a un t iempo
dado y permit en ident ificar cuart iles de int erés ( p. ej . la mediana) . Si las curvas
se cor t an est amos ant e una sit uación de modelos no pr opor cionales.
La for ma de calcular la est imación de Kaplan- Meier par a cada gr upo m, m= 1,
…, r , es


·
·
j
1 i
mi
mi mi
mj
n
d n
) t ( S
si endo t
m1
<t
m2
< …< t
mk
los t iempos or denados de ocur r encia de suceso par a el
gr upo m, n
mj
el númer o de individuos en r iesgo del gr upo m en t
mj
y d
mj
el
númer o de individuos del gr upo m que exper iment an el suceso en t
mj
.
Si las curvas se cort an est amos ant e una sit uación de modelos no
pr opor cionales y se desaconsej a el uso de la r egr esión de Cox como modelo de
est imación.
Regr esi ón de Cox
La regresión de Cox se ut iliza cuando se quiere analizar la variable respuest a
“ t iempo hast a que ocur r e un suceso” en f unción de var ias var iables
explicat ivas. La par t icular idad de est a t écnica es que t r abaj a con dat os
censurados, es decir con información parcial.
El modelo de r egr esión de Cox par a p var iables explicat ivas x
1
, x
2
, …, x
p
es
( ) ( ) ( )
p p 1 1 0 p 2 1
x b ... x b exp t h x ..., , x , x , t h + + ⋅ ·
donde h( t , x
1
, x
2
, …, x
p
) es la función de r iesgo par a un individuo con per fil ( x
1
,
x
2
, …, x
p
) a t i empo t y h
0
( t ) represent a la función de riesgo basal para un
individuo con x
1
= 0, x
2
= 0, …, x
p
= 0 y b
j
est á asociado a la var iable explicat iva j -
ési ma.
Est os coeficient es se det erminan maximizando la función de verosimilit ud de la
muest ra. El procedimient o de maximización se realiza por el mét odo it erat ivo
de Newt on- Raphson, disminuyendo en cada it er ación el “ –2Log Likelihood” ,
hast a alcanzar su valor mínimo en el modelo final. Est e mét odo además de
proporcionar los coeficient es del modelo, t ambién facilit a sus errores est ándar.
A par t ir de los coeficient es b
j
y de los errores est ándar EE( b
j
) se const r uye el
est adíst ico de cont r ast e de Wald con
222
2
j
j
j
) b ( EE
b
Wal d

,
`

.
|
·
que sigue una Chi- Cuadr ado con 1 gr ado de liber t ad.
El coeficient e de correlación parcial R se calcula como
) 0 ( LL 2
2 Wal d
R
j


·
donde –2LL( 0) es menos dos veces el logar it mo neper iano de la función de
cuasi- ver osimilit ud en el paso inicial ( paso cer o) . El signo de R es el signo del
coef icient e. Si Wald es menor que dos, se consider a R igual a cer o.
El cont r ast e de aj ust e del modelo ( Difer encia de Likelihood) cont r ast a si el
decr ement o en el “ –2Log Likelihood” ent r e el modelo nulo ( sin incluir ninguna
var iable explicat iva) y el modelo final es significat ivo, siendo el númer o de
gr ados de liber t ad del est adíst ico de cont r ast e el númer o de var iables
explicat ivas) . No r echazar la hipót esis nula equivale a acept ar que
conj unt ament e las var iables explicat ivas no son r elevant es en el modelo ( sus
coeficient es son t odos nulos) .
La medida de ef ect o de cada var iable se calcula a t r avés del “ Hazar d Rat io”
( HR) que viene dado por la exponencial del coeficient e. Los int ervalos de
conf ianza del 95% de cada “ Hazar d Rat io” vienen dados por
( ) ( ) ( ) ( ) ( )
j j j j
b EE 96 . 1 b exp , b EE 96 . 1 b exp + −
Un HR significat ivament e mayor que uno indica que un incr ement o en la
var iable explicat iva se asocia a un incr ement o en el r iesgo y, por t ant o, a una
disminución en la super vivencia. I gualment e, un HR significat ivament e menor
que uno indica que un incr ement o en la var iable explicat iva se asocia a un
decr ement o en el r iesgo y, por t ant o, a un aument o en la super vivencia. El HR
se considerará significat ivament e diferent e de 1 si es significat ivament e
dist int o de cer o el coeficient e cor r espondient e en el modelo
Manej o del programa
Var i abl es: Se i dent i f i ca l a Variable respuest a cuant it at iva, la Variable
de censura di cot ómi ca y l a( s) Variable( s) explicat iva( s) cuant it at ivas.
Las var iables no deben t ener var ianza cer o.
Manual G- St at 2. 0 223
Est adíst i cos: Est adíst icos de las var iables explicat ivas par a cada nivel
de la var iable censur a. Se det allan en Cuant it at iva ( y) . Sólo se t ienen
en cuent a los r egist r os complet os par a t odas las var iables analizadas.
Kapl an- Mei er Tabl a: Par a cada t iempo exact o se incluye, según el
mét odo de Kaplan- Meier, la probabilidad de supervivencia y la mediana
del t iempo de super vivencia.
Opci ones:
- Se ident ifica código par a dat os censur ados.
- Obt ener las probabilidades de supervivencia para t odos los
casos o est r at ificar las por gr upos de una var iable explicat iva del
model o.
Kapl an- Mei er Gr áf i co: Par a cada t i empo exact o se i ncl uye, según el
mét odo de Kaplan- Meier , la cur va de pr obabilidad de super vivencia.
Opci ones:
- Se ident ifica código par a dat os censur ados.
- Obt ener las probabilidades de supervivencia para t odos los
casos o est r at ificar las por gr upos de una var iable explicat iva del
model o.
- La cabecer a, el t ít ulo, el mínimo, máximo e incr ement o del
ej e X y del ej e Y.
Model o: Se muest r a el pr oceso it er at ivo de disminución del est adíst ico
“ - 2Log Likelihood” , la ecuación del modelo, los “ Odds rat io” y la t abla
de clasif icación.
Opci ones:
- Se ident ifica código par a dat os censur ados.
- Selección de var iables: incluir t odas, aplicar un pr ocedimient o
paso a paso hacia adelant e o hacia det r ás.
- Nivel de signif icación p par a ent r ar y par a salir en el pr oceso
secuencial de selección del modelo: las var iables van ent r ando
en el modelo si r ealment e lo mej or an más allá de lo que podr ía
deber se al azar ( p- par a- ent r ar ) y pueden salir si no mej or an el
modelo significat ivament e ( con relación a p- para- salir) .
224
- Valor alfa par a const r uir los int er valos de confianza par a el OR
asociado a cada variable explicat iva del modelo. En las
opciones el valor por def ect o de alf a es 5% que cor r esponde a
un I C del 95%. Alfa debe ser > 0 y < 100.
- Númer o máximo de it er aciones que se per mit e.
Por defect o, el programa t iene marcadas las opciones: código
de censura igual al primer valor en el fichero de dat os para la
variable censura, incluidas t odas las variables, p- para- ent rar y
p- par a- salir con valor 0. 1, alfa de un 5% y el númer o máximo
de it er aciones es 20.
Aunque el algor it mo ut ilizado es r obust o en la mayor ía de sit uaciones,
no se asegur a la conver gencia en t odas los casos.
: Se desea model i zar l a var i abl e Meses medi ant e l as var i abl es
Sex o, Ant i güedad y Edad medi ant e un model o de r egr esi ón de Cox
ut i l i zando Cens como v ar i abl e de censur a ( códi go= 0) y el r est o de
v ar i abl es como v ar i abl es ex pl i cat i v as. Los dat os son l os si gui ent es:
Meses Cens Sex o Ant i güedad Edad
12 1 1 2 45
12 1 1 2 45
12 1 1 2 45
23 0 0 2 34
23 0 0 2 34
24 1 1 3 23
24 1 1 3 23
24 1 1 3 23
25 1 0 2 34
25 1 0 2 34
34 1 1 6 45
35 1 0 4 56
35 1 0 4 56
45 1 1 6 45
45 1 1 6 45
45 1 1 6 45
46 1 0 5 34
46 1 0 5 34
45 0 1 4 23
45 1 1 5 34
45 1 1 5 34
34 1 0 6 45
Manual G- St at 2. 0 225
Result ados est adíst icos par ciales.
Regresión de Cox. Estadísticos
======================================================================
Variable Respuesta: meses
Variable de Censura: cens
Variable(s) Explicativa(s): sexo, anti, edad
Número de Casos: 22
Variable=meses
Desviación
cens N Media Mediana Típica Mínimo Máximo
--------------------------------------------------------------------
1 19 32.2632 34.0000 12.3641 12.0000 46.0000
0 3 30.3333 23.0000 12.7017 23.0000 45.0000
--------------------------------------------------------------------
Total 22 32.0000 34.0000 12.1185 12.0000 46.0000
Variable=sexo
Desviación
cens N Media Mediana Típica Mínimo Máximo
-----------------------------------------------------------------
1 19 0.6316 1.0000 0.4956 0.0000 1.0000
0 3 0.3333 0.0000 0.5774 0.0000 1.0000
-----------------------------------------------------------------
Total 22 0.5909 1.0000 0.5032 0.0000 1.0000
Cur vas de la función de super vivencia por Kaplan- Meier par a los gr upos
for mados por la var iable Sexo con código de dat o censur ado= 0.
226
Result ados del Modelo de la r egr esión de Cox, con selección de t odas las
var iables sin most r ar las it er aciones.
Regresión de Cox. Modelo
======================================================================
Variable Respuesta: meses
Variable Censura: cens
Valor asociado al dato censurado: cens=0
Valor asociado al dato exacto: cens=1
Variable(s) Explicativa(s): sexo, anti, edad
Número de Casos: 22
Número de casos censurados: 3
Número de casos exactos: 19
Número de casos excluidos (*): 0
(*) Correspondientes a casos censurados antes del primer evento
Función Logaritmo de la Verosimilitud LL (Log Likelihood)
------------------------------------------------------------
-2 Log Likelihood = 88.8187 (Modelo Nulo)
-2 Log Likelihood = 70.3077
-2 Log Likelihood = 68.7764
-2 Log Likelihood = 68.6199
-2 Log Likelihood = 68.6141
-2 Log Likelihood = 68.6141
-2 Log Likelihood = 68.6141 (Modelo Final)
Ajuste del Modelo (Diferencia de Likelihood)
------------------------------------------------------------------
Chi-Cuadrado = 20.2047; G.L. 3; p-valor = 0.0002
Regresión de Cox
--------------------------------------------------------------------
Variable Coef. E.E. Wald G.L. p-valor R
--------------------------------------------------------------------
sexo 2.7028 1.3683 3.9016 1 0.0482 0.1463
anti -1.4654 0.5059 8.3910 1 0.0038 -0.2682
edad 0.1072 0.0494 4.7147 1 0.0299 0.1748
Variable HR IC95.0%inf IC95.0%sup
-----------------------------------------------
sexo 14.9217 1.0211 218.0465
anti 0.2310 0.0857 0.6226
edad 1.1132 1.0105 1.2263
Manual G- St at 2. 0 227
Menú Ayuda
Act ivar la opción Ay uda del menú pr incipal o mediant e Alt + Y. Est e menú
cont iene las opciones relacionados con la ayuda del programa. Est as opciones
conect an con la pagina www.g- st at .es, donde se encuent ra act ualizada dicha
inf or mación.
Manual del G- St at
Cont iene información act ualizada en I nt ernet sobre est e manual.
Dónde Encont r ar
Cont iene las rut as de los diferent es análisis y t écnicas est adíst icas cont enidas
en est e pr ogr ama.
Acer ca de G- St at
Cont iene información act ualizada sobre los crédit os del programa y condiciones
de ut i l i zaci ón.
228
Manual G- St at 2. 0 229
Bi bl i ogr af ía
Armit age, P. ; Berry, G. ; Mat t hews, J. N. S. St at ist ical Met hods in Medical
Research. Blackwell Science Publicat ions, Oxford, 2002 .
Box, G. E. P. ; Hunt er, W. G. ; Hunt er, J. S. St at ist ics for Experiment ers. John
Wiley & Sons, New Yor k, 1 9 7 8 .
Clegg, F. Est adíst ica Fácil. Aplicada a las Ciencias Sociales. Gr ij albo, Bar celona,
1984 .
Collet t , D. Modelling Binary Dat a. Chapman & Hall, Londr es, 1991 .
Collet t , D. Modelling Survival Dat a in Medical Research. Chapman & Hall,
Londr es, 1994 .
Daniel, W. W. Applied Nonparamet ric St at ist ics. PWS- KENT Publishing
Company, Bost on, 1990 .
Desu, M.M.; Raghavarao, D. Nonparamet ric st at ist ical met hods for complet e
and censored dat a. Chapmam & Hall/ CRC, Flor ida, 2 0 0 4 .
Fleiss, J.L. St at ist ical Met hods for Rat es and Proport ions. John Wi l ey & Sons,
New Yor k, 1 9 8 1 .
Gonick, L. ; Smit h, W.The Cart oon Guide t o St at ist ics. HaperPerennial, New
York, 1 9 9 3 .
Hosmer, D. W; Lemeshow, S. Applied Logist ic Regression. John Wi l ey & Sons,
New Yor k, 1 9 8 9 .
Juez, P. ; Díez, F. C. Probabilidad y Est adíst ica en Medicina. Di az de Sant os,
Madr id, 1996 .
Kleinbaum, D. G. ; Kupper. L. L. ; Muller, K. E. ; Nizam, A. Applied Regression
Analysis and Mult ivariable Met hods. Duxbur y Pr ess, Pac. Gr ove, 1998 .
230
Lee, E. T. St at ist ical Met hods for Survival Dat a Analysis. John Wi l ey & Sons,
New Yor k, 1 9 9 2 .
Let ón, E. ; Pedromingo, A. Fundament os Teóricos del Análisis de Supervivencia.
GSK, Madrid, 1 9 9 6 .
Let ón, E. ; Pedromingo, A. I nt roducción al Análisis de Dat os en Met a- Análisis.
Díaz de Sant os, Madr id, 2001 .
Marubini, E. ; Valsecchi, M. G. Analysing Survival Dat a from Clinical Trials and
Observat ional St udies. John Wiley & Sons, Chichest er , 1 9 9 5 .
Mat t hews, D. E. ; Farewell, V. T. Using and Underst anding Medical St at ist ics.
Karger, Basel, 1 9 8 8 .
Norman, G. ; St reiner, D. Biost at ist ics: The Bare Essent ials. Mosby Year Book,
St . Louis, 1994 .
Pedromingo, A. ; Let ón, E. 118 ej ercicios de Est adíst ica Básica aplicados a las
Ciencias de la Salud. GSK, Madr id, 1994 .
Ríos, S. I niciación Est adíst ica. Paraninfo, S. A. , Madrid, 1992 .
Snedecor, G. W. ; Corchran, W. G. St at ist ical Met hods. The I owa St at e Univer sit y
Pr ess, I owa, 1 9 8 0 .
Wang, C. Sense and Nonsense of St at ist ical I nference. Mar cel Dekker , New
York, 1 9 9 3 .
Wooding, W. M. Planning Pharmaceut ical Clinical Trials. John Wiley & Sons, New
York, 1 9 9 4 .

2

Autores
Emilio Letón Molina Alejandro P. Marino Dpto. Biometría, GlaxoSmithKline S.A., Tres Cantos, Madrid

Edita GlaxoSmithKline S.A. ISBN:84-607-5171-6. Registro Legal: M-37418-2002

Consultores informáticos y estadísticos Sacha Arozarena, Alfonso Palacios, Álvaro Trigo, Gema Núñez (ASI, Madrid); Llorenç Badiella (Universitat Autònoma, Barcelona)

Condiciones de utilización
La distribución de este programa se realiza sobre la base del concepto de distribución gratuita. Los propietarios renuncian a los derechos de comercialización aunque mantienen los derechos de propiedad intelectual e industrial. La cesión libre y gratuita de G-Stat no incluye la cesión de los derechos de propiedad del programa. Por ello los usurarios no podrán: - Modificar los programas contenidos en G-Stat ni realizar versión alguna del código fuente por decompilación u otro método. - Alterar, modificar o adaptar la documentación, el programa o el aspecto de las pantallas. Los propietarios no se hacen responsables de los daños y perjuicios, directos o indirectos, especiales o incidentales, que se deriven del uso y utilización, debida o indebida, del programa o de la documentación que se adjunta. No se permite la reproducción total o parcial de esta publicación, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro u otros métodos, ni su préstamo, alquiler o cualquier otra forma de cesión de uso de este Manual, sin el permiso previo y por escrito de los propietarios del programa.

Actualizaciones de este manual
En www.g-stat.es se encuentrán las versiones actualizadas de este manual.

Manual G-Stat 2.0

3

Contenido
Generalidades Descripción
Requerimientos del equipo Instalación Mejoras con respecto a las versiones 1.x Notas sobre el manual Arranque de G-Stat

9 9
9 9 10 12 13

Menú Principal
Navegación Botones

15
15 15

Menú Archivo
Nuevo Abrir Archivo Instrucciones para importar archivos Comienzo Rápido Guardar Guardar Como … Imprimir Salir

17
17 19 20 20 20 20 22 22

Menú Editar
Cortar Copiar Pegar

23
23 24 24

4

Eliminar Variable / Registro Insertar Variable Insertar Registro Ordenar Compactar Tabla Buscar Ir a Registro

24 24 25 25 25 25 26

Menú Utilidades
Editor de texto Transformar Recodificar Filtrar Datos Ejemplo

27
27 27 28 29 30

Menú Gráficos
Barras (a) Histograma (y) Cajas (y) Series Temporales (y) Barras (a|b) Cajas (a|y) Bloques de Medias y Desviaciones (a|y) Dispersión (x|y)

31
31 32 33 34 36 37 38 39

Menú Descriptiva
Validación Cualitativa (a) Cualitativas (a)(b) Cuantitativa (y) Cuantitativas (x)(y)

41
41 42 43 43 48

Tablas (a|b)
Tablas (a|b) à Tablas

49
50

Manual G-Stat 2.0

5

Tablas (a|b) à Tablas. Datos agrupados Tablas (a|b|c) Grupos (a|y) Grupos (a*b|y) Grupos (a*b*c|y) Grupos (a|xyz) x|y

54 56 57 58 60 60 61

Menú Análisis Distribuciones
Distribuciones Distribuciones Distribuciones Distribuciones Distribuciones Distribuciones Distribuciones Distribuciones Distribuciones Distribuciones à à à à à à à à à à Normal Normal Inversa t-Student t-Student Inversa Chi-Cuadrado Chi-Cuadrado Inversa F F Inversa Rango Estudentizado Inversa Shapiro Wilk

67 67
68 68 68 69 69 69 70 70 71 71

Cualitativa (a)
Cualitativa (a) à Una proporción Cualitativa (a) à Una proporción. Datos Agrupados

72
72 74

Cuantitativa (y)
Cuantitativa Cuantitativa Cuantitativa Cuantitativa Cuantitativa Cuantitativa Tablas Tablas Tablas Tablas Tablas (a|b) (a|b) (a|b) (a|b) (a|b) (y) (y) (y) (y) (y) (y) à à à à à à à à à à à Ajuste t-Student Chi-2 para una Desviación Típica t-Student y Chi-2 para dt. Datos Agrupados Rangos Signados Signos

76
76 79 82 84 85 87

Tablas (a|b)
Chi-Cuadrado Chi-Cuadrado. Datos Agrupados Dos Proporciones. Datos Agrupados Chi-Cuadrado de Tendencia Lineal (y|b) Chi-Cuadrado de Tendencia Lineal. D. Agrup. (y|b)

90
90 92 93 96 98

6

Tablas Tablas Tablas Tablas

(a|b) (a|b) (a|b) (a|b)

à à à à

Fisher Fisher. Datos agrupados McNemar McNemar. Datos Agrupados

100 101 103 105

Epidemiología (b|b)
Epidemiología (b|b) à Tablas Epidemiología (b|b) à Tablas. Datos Agrupados Epidemiología (b|b) à Mantel-Haenszel. D. Agrupados (c|(b|b))

106
106 109 110

Diagnóstico (b|b)
Diagnóstico (b|b) à Tablas Diagnóstico (b|b) à Tablas. Datos Agrupados Diagnóstico (b|b) à ROC (y|b)

116
116 121 123

Dos Grupos (b|y)
Dos Dos Dos Dos Dos Dos Dos Grupos Grupos Grupos Grupos Grupos Grupos Grupos (b|y) (b|y) (b|y) (b|y) (b|y) (b|y) (b|y) à à à à à à à t-Student t-Student. Pareados F-Snedecor t-Student y F-Snedecor. Datos Agrupados Mann-Whitney (Wilcoxon) Wilcoxon. Pareados Signos. Pareados

125
125 128 130 133 135 139 141

Dos Grupos (b|y cens)
Dos Grupos (b|y cens) à Log-Rank

142
142

x|y
x|y à Regresión Lineal Simple x|y à Modelos Transformados x|y à Regresión Polinómica

144
145 151 152

Menú Anova Anova Un Factor (a|y) Anova Un Factor (a|y). Datos Agrupados Kruskal-Wallis (a|y) Anova Un Factor con Bloque (a bloque|y) Friedman (a bloque|y) Anacova (ax|y) Anova Dos Factores (ab|y) Anova Factorial (abc|y)

157 157 168 170 173 180 183 191 199

Manual G-Stat 2.0

7

Menú Multivariante Regresión Múltiple (xz|y) Regresión Logística (xz|b) Regresión de Cox (xz|y cens) Menú Ayuda
Manual del G-Stat Dónde Encontrar Acerca de G-Stat

207 208 215 220 227
227 227 227

Bibliografía

229

8

regresión lineal múltiple. técnicas de estimación y pruebas estadísticas univariantes y bivariantes. estadística descriptiva.0 9 Generalidades Descripción El departamento de Biometría de GSK ha desarrollado el programa G-Stat 2. gráficos.com . Linux y Macintosh.htm y seguir las instrucciones. regresión logística y regresión de Cox. Para el manejo del programa no es necesario tener amplios conocimientos estadísticos. un programa completo de análisis estadísticos. de una forma rápida y fácil. Requerimientos del equipo Los requisitos recomendados para que G-Stat funcione de forma satisfactoria son: Procesador Pentium 350 MHz o similar 128 MB de memoria RAM 100 MB de espacio libre en disco duro Lector de CD Pantalla VGA (1024 x 768) con 256 colores de resolución Impresora configurada Instalación Ejecutar el archivo Install. paramétricas y no paramétricas. Está diseñado para que el usuario pueda realizar.es www.0. Incluye base de datos. G-Stat es un programa estadístico que se ha desarrollado en Java y que se puede instalar bajo Windows.e-biometria. Información actualizada sobre G-Stat se encuentra en: www. técnicas de diagnóstico y de epidemiología. Unix.g-stat. El programa se maneja por menús y no requiere programación.Manual G-Stat 2. Asimismo. incluye técnicas multivariantes esenciales como el análisis de la varianza. análisis estadísticos con resultados tanto gráficos como numéricos.

Chi-Cuadrado de tendencia lineal.10 Nota G-Stat es un programa multisistema operativo. Series temporales: gráficos. Técnicas de Diagnóstico. Prueba de Fisher para datos agrupados. Levene. Chi-Cuadrado para datos agrupados. Mac. Muchos usuarios encontrarán características similares a los programas en Windows. Curvas ROC. . alisado exponencial con doble parámetro de Holt-Winters. Breslow-Day. Chi-Cuadrado de tendencia lineal para datos agrupados. Instalación Incorporación de un instalador o asistente que permite la instalación más fácil en los principales sistemas operativos: Win. pero al ser una aplicación programada en Java su apariencia y uso puede diferir. Estadísticos de asociación para datos agrupados. Diagnóstico para datos agrupados. Linux y Unix. Regresión de Cox hacia adelante y hacia detrás. Regresión Logística hacia adelante y hacia detrás. Coeficiente Kappa de concordancia. Cox-Snell y Nagelkerke. alisado exponencial. Prueba de McNemar para datos agrupados. Mejoras con respecto a las versiones 1. Anova Un Factor para datos agrupados. Prueba de Log-Rank. Prueba z-proporción para datos sin agrupar Prueba de Shapiro-Wilk. medias móviles.x Técnicas nuevas incorporadas Gráficos de bloques de medias y desviaciones típicas. Comparaciones múltiples a posteriori no paramétricas de Dunn. Mantel-Haenszel para datos agrupados. Epidemiología para datos agrupados. Coeficiente de correlación intraclase.

- - . Se ha incorporado un botón de Imprimir en todas las pantallas de resultados. En los menús se incluyen pistas abreviadas de utilización de las técnicas. Nuevos estadísticos para el término constante. hacia delante y hacia detrás. Se ha mejorado el código para asegurar la convergencia mediante el método de “half-step”. número máximo de iteraciones. Aumento de la robustez: controles de funcionamiento para casos y ficheros extremos. mostrar las iteraciones. Regresión Logística Rediseño del código de programación incorporando optimización en el cálculo matricial del producto por matrices diagonales para incrementar la rapidez de su ejecución. Se incluyen instrucciones para importar datos de Excel y otros programas.Manual G-Stat 2. Regresión Lineal Múltiple Se ha mejorado la velocidad del cálculo de los residuos “jacknife”.0 Desaparece la pantalla negra cuando se instala en Windows. punto de corte. Control sobre el número de decimales de cada variable. Estandarización y desestandarización interna de las variables para eliminar errores de redondeo. Separación del cálculo de la verosimilitud para evitar realizar operaciones no factibles con logaritmos neperianos. p-para-salir. p-paraentrar. 11 General Se ha incorporado un reloj para indicar que una técnica se está procesando. Nuevas opciones para realizar el modelo: con constante y sin constante. Se han ampliado las ayudas “on-line” del programa en todos los botones de Ayuda. selección en bloque . Avisos en operaciones no adecuadas. Se detectan situaciones anómalas de convergencia: separación y cuasiseparación. punto de corte. Se incluyen las predicciones del modelo.

Rangos signados. p-para-entrar. Corrección de errores En el manejo de la base de datos: insertar y eliminar registros.es información actualizada del programa. punto de corte. número máximo de iteraciones. La principal función consiste en proporcionar la formulación empleada en la programación. Etiquetas e impresión de los gráficos. hacia delante y hacia detrás. Separación del cálculo de la verosimilitud para evitar realizar operaciones no factibles con logaritmos neperianos. Distribución Normal para valores negativos. - Dominio Web Propio G-Stat cuenta con dominio propio: www. Mann-Whitney y Wilcoxon Pareados en situaciones extremas. aunque no afectaban al cálculo del p-valor Lilliefors corregido. No se pretende que los usuarios aprendan estadística con la información aquí contenida. Se han corregido algunos errores en el cálculo de los estadísticos D+ y Dde Kolmogorov. . Se ha mejorado el código para asegurar la convergencia mediante el método de “half-step”. mostrar las iteraciones. Etiqueta de los grados de libertad en el Anova Un Factor con Bloques Regresión Lineal Múltiple sin constante hacia delante y hacia detrás. Contraste de hipótesis de una proporción. p-para-salir. Fisher se ha corregido en el caso de que se utilice en su cálculo factoriales de números elevados. Nuevas opciones para realizar el modelo: selección en bloque. Homogeneización entre clases e histogramas.g-stat.12 Regresión de Cox Estandarización y desestandarización interna de las variables para eliminar errores de redondeo. donde se encuentra Notas sobre el manual Este manual no es un libro de estadística.

al igual que en el programa se repiten técnicas. Sin embargo. errores de protección general según la plataforma. Pantalla principal del programa. ocasionalmente.0 13 El Manejo del programa es en su mayor parte autoexplicativo. Como norma general conviene usar siempre ficheros con al menos dos líneas de datos y que no haya variables constantes. Las opciones de Multivariante en algunas ocasiones pueden tardar cierto tiempo si hay muchos datos. en este manual la información es redundante.Manual G-Stat 2. . los salvapantallas y los antivirus (u otros programas residentes) pueden provocar. Arranque de G-Stat El programa G-Stat es compatible con otros programas y está validado en modo multitarea. pero facilita el manejo. Barra de título: Está situada en la parte superior de la ventana y contiene el nombre del programa. En muchas ocasiones. Menú principal: Está debajo de la barra de título. Menú Principal y Barra de Iconos. compuesta por Barra de título. Al arrancar el programa aparece la pantalla principal. No se incluyen ejemplos en todas las técnicas. sólo en las que se ha considerado de más interés o más didácticas. Ésta es la pantalla para la introducción y manejo de datos. Mucha de la ayuda contenida en esta manual está incluida en los botones de ayuda de las pantallas de resultados. el equipo y el software con el que se esté trabajando. Éste llevará a los submenús con las opciones principales del programa.

Los iconos activan las siguientes opciones: Abrir Archivo Guardar Archivo Editor de Texto Transformar Ejemplo Validación Contraste de hipótesis de dos proporciones McNemar Chi-Cuadrado t-Student Man-Whitney (Wilcoxon) Regresión Lineal Simple Kruskal-Wallis Anacova Anova Dos Factores Regresión Múltiple Regresión Logística Regresión de Cox Manual de G-Stat * Salir * *Visible en pantallas superiores a 17 pulgadas o resoluciones superiores a 800 x 600 pixeles. . Al posicionar el puntero encima del icono se identifica la opción.14 Barra de iconos: Se encuentra después del menú principal y dispone de una serie de iconos que permiten realizar ciertas operaciones directamente. sin necesidad de utilizar los menús.

Generalmente las opciones de las pestañas son independientes. Guardar: Abre el cuadro de diálogo para guardar el gráfico en un fichero. . Las ventanas de resultados contienen pestañas con diferentes subanálisis. El programa no realiza las operaciones si las opciones no se confirman mediante el botón Aceptar. Sin embargo. En muchas de las pantallas de resultados se encuentran botones que abren las ventanas de opciones de análisis. cualquier cambio en la ventana de datos no tiene efecto en las ventanas de resultados abiertas. Opciones: Opciones relacionadas con la técnica estadística o gráfico. Para actualizar los resultados hay que actualizar sus ventanas.Manual G-Stat 2.0 15 Menú Principal Navegación El menú principal está compuesto por submenús que contienen las funciones más usuales de los programas utilizados en Windows y aquellas que proporciona el programa G-Stat. Cancelar: Cierra la ventana sin aceptar lo realizado. Imprimir: Muestra el cuadro de diálogo de impresión. Todos los menús contienen submenús. Ayuda: Da información complementaria para interpretación de resultados. El acceso a las opciones de los menús se realiza por puntero o mediante combinaciones de teclas. de tal manera que el usuario debe confirmar en cada pestaña si las opciones son las adecuadas y no confiarse en las opciones por defecto del programa ni en cambios previos. Imprime el gráfico. Botones En la mayoría de las ventanas del programa G-Stat se encuentran los siguientes botones: Aceptar: Cierra la ventana aceptando lo realizado. La navegación por el programa permite abrir simultáneamente varias ventanas.

16 .

Aparece una pantalla que pregunta si se desea guardar el archivo actual. Nuevo Crea una nueva base de datos vacía.0 17 Menú Archivo Activar la opción Archivo del menú principal o mediante Alt+A. Este menú contiene las opciones para el manejo de la base de datos. Introducido el número de filas y columnas pulsar el botón Aceptar. se abrirá una ventana donde se tiene que introducir el número de casos (Filas) y el número de variables (Columnas). Ventana de definición de la estructura de la base de datos nueva. .Manual G-Stat 2. Después de aceptar. Por defecto G-Stat siempre crea una base de datos con 100 filas y 10 columnas.

• Tipo de variables El programa admite variables numéricas y alfanuméricas. Se puede emplear tanta precisión como se desee para cada variable. Si por error se emplea la coma o se importa un fichero de datos que emplea la coma como separador decimal. para la realización de la mayoría de las pruebas y técnicas estadísticas se exige que las variables sean numéricas. Es recomendable. excepto en las técnicas estadísticas que operan simultáneamente con varias variables. Sin embargo. Es posible recodificar valores de variables nominales o dicotómicas mediante la opción "Recodificar" del menú "Utilidades". • Valores "Missing" El programa admite valores “missing” o “valores faltantes”. Para moverse por la base de datos ir directamente con el puntero o con los cursores del teclado. El programa trata las variables fecha como variables nominales. la consignación de las variables como numéricas aunque su naturaleza sea nominal o dicotómica.18 Entrada de datos Para introducir los datos de cada registro. • Disposición de los datos La hoja de datos está estructurada en una cuadrícula de filas y columnas: las filas corresponden a los individuos o casos y las columnas a las variables. por tanto. El número de decimales no tiene por qué ser el mismo para los diferentes valores numéricos de una variable. hacer clic en la casilla correspondiente. Un valor missing en una variable no anula el registro. • Menú contextual El botón derecho activa el menú contextual en la hoja de datos activando las opciones: Cambiar Nombre Número de Decimales Insertar Variable Eliminar Variable Orden Ascendente Orden Descendente Recodificar . Para editar cualquier valor hacer doble clic en la casilla correspondiente. los datos serán tratados como alfanuméricos. • Decimales Se utiliza el punto como separador decimal.

se selecciona la unidad. el directorio y el nombre de fichero. Esta opción permite abrir ficheros mediante el cuadro de diálogo de apertura de ficheros. • Formato Es posible variar la anchura de las columnas situando y moviendo el cursor entre las líneas de separación de las variables. El tamaño de la pantalla de la hoja de datos es ajustable mediante los cursores activos en los laterales y en el extremo inferior derecho. El tipo de variable y el número de decimales es reconocido automáticamente por el programa. La tecla "Enter" mueve el cursor a la celda inferior. El nuevo dato sobreescribirá el antiguo. Alternativamente utilizar el cursor del ratón y las teclas de avance rápido de página. • Editar un dato Hacer doble clic sobre la celda. se cerrará el fichero que estaba activo hasta ese momento. Mediante las teclas “Ctrl-Fin” se posiciona en el final de la base de datos. Al abrir una base de datos. Hecha la selección del archivo. El programa contiene una base de datos "ejemplo" que se copia automáticamente al realizar la instalación y que se abre mediante el menú Utilidades o mediante el icono correspondiente. hacer un solo clic sobre la celda. pulsar el botón Aceptar e introducir las características del fichero. Para editar parcialmente un valor hacer doble clic y.0 19 La mayoría de estas opciones se encuentran también disponibles en los menús “Editar” y “Utilidades”. automáticamente. Al seleccionar esta opción aparecerá una pantalla que pregunta si se desea guardar el archivo actual.Manual G-Stat 2. tras una pausa. hacer un clic sobre la celda. . En el cuadro de diálogo Abrir archivo. Para añadir. • Navegación Utilizar las teclas de posición para moverse por la cuadrícula. Mediante las teclas “Ctrl-Inicio” se posiciona en el comienzo de la base de datos. Abrir Archivo (Ctrl+O).

. SPSS o cualquier otro programa. Aparece el cuadro de diálogo de características del fichero. Esto se cambia en Menú de Inicio / Configuración / Panel de Control / Configuración Regional / Pestaña: Número / Campo: Signo Decimal. realizar los siguientes pasos: 1. Guarda las últimas modificaciones de la base de datos que está en uso. Hay que tener en cuenta que el separador decimal debe ser el punto en lugar de la coma.Abrir el archivo de texto con G-Stat mediante Archivo / Abrir Archivo. realizar los siguientes pasos: 1.Desde Excel.20 Instrucciones para importar archivos Para importar datos desde Excel. los pasos que habría que seguir para realizar la prueba de comparación de medias t-Student. El objetivo de este menú es facilitar una guía rápida (en un minuto) de las posibilidades del programa. Una vez elegidas las características del fichero. . a modo de ejemplo... hacer Archivo / Guardar como: guardar como tipo: texto (delimitado por tabulaciones). no estará guardada aún y aparecerá la ventana de Guardar como. 2. Guardar (Ctrl+G).Exportar los datos a texto y seguir el paso 2 anterior o exportar los datos a Excel y seguir los pasos 1 y 2 anteriores. Comienzo Rápido Se incluye. Guardar Como … Guarda el fichero en otra ubicación. Si la base de datos es nueva. Para importar datos desde Access. Seleccionadas las características hacer clic en el botón Aceptar. aparece la ventana Guardar como donde se selecciona la unidad y el directorio donde se desea guardar la base de datos y su nombre.

Manual G-Stat 2. en Mis Documentos. .0 21 : Guardar la base de datos en otra ubicación. Ventana "Guardar como" del programa. por ejemplo. Opciones de "Guardar Como" con las características de los registros.

saldrá la ventana de características de la base de datos. Con el botón No.O.22 Imprimir (Ctrl+P). Se abre la ventana de impresión del sistema operativo (S. . una vez realizada la selección se acepta y se sale de la aplicación.). se sale directamente del programa sin guardar los cambios. Al salir del programa se muestra un mensaje por si se desea guardar las últimas modificaciones realizadas. Permite salir del programa. Imprime la base de datos activa. Si se selecciona el botón Sí. Salir (Alt+X). Se selecciona la impresora y el número de copias a realizar.

para insertarlos en otras celdas de la base de datos o para pegarlos en otra base de datos. Activar la opción Cortar.Manual G-Stat 2. exportarla a G-Stat mediante su conversión en fichero texto separado por tabuladores (opción recomendada) y con el nombre de las variables en primera fila. Cortar (Ctrl+X). Se inserta o pega a través de la opción Pegar. Se borrarán los registros seleccionados y se copiarán en el portapapeles. .0 23 Menú Editar Activar la opción Edición del menú principal o mediante Alt+E. Permite cortar uno o varios registros para eliminarlos de la base de datos activa. Seleccionar la o las casillas a cortar. Se recomienda realizar las operaciones previas en la base de datos con otras herramientas más potentes. G-Stat permite la edición y grabación de datos pero no es un programa especialmente diseñado para la gestión avanzada de bases de datos. Esto no altera el funcionamiento del programa ya que sólo considera los registros que contienen información en alguna de las variables. El programa añade automáticamente filas vacías en la base de datos cuando se añaden o suprimen líneas (registros). Este menú contiene las opciones relativas a la edición de texto. y una vez validada la base de datos.

Se sitúa el cursor en la variable anterior a la que se va insertar. Pegar (Ctl+V). Eliminar Variable / Registro Elimina uno o varios registros o variables de la base de datos. Permite realizar una copia de uno o varios registros para pegarlo en la misma base de datos o en otra. Se crea la nueva variable vacía.24 Copiar (Ctrl+C). Se activa la opción correspondiente y aparece un cuadro de diálogo para asegurar que se desea eliminar la variable o el registro. Se selecciona la opción Insertar Variable. En el caso de que sea más de uno se selecciona la primera casilla. Los pasos a seguir son los mismos en estas dos últimas opciones. Se selecciona la opción Insertar. Se seleccionan los registros y se activa la opción Copiar. Pega la información guardada en el portapapeles. Aparece una ventana en la cual se tiene que introducir el nombre de la nueva variable. . Insertar Variable Inserta una variable nueva a la base de datos activa. La información se copiará en el portapapeles. Se sitúa el cursor en la casilla donde se va a pegar el registro. Se posiciona el cursor en la variable FC2FC1. : Insertar la variable FC1+FC2 después de la variable FC2. Se pulsa Aceptar para eliminar. se selecciona con el puntero la(s) variable(s) o registro(s) a eliminar.

Seleccionada la opción Buscar. señalando varias filas en el marcador a la izquierda. Ordenar Se coloca el puntero en la variable por la cual se quiere ordenar la base de datos. si no existe dicho . Estos registros finales vacíos no son nunca considerados en los cálculos estadísticos. Ordena de forma ascendente o descendente la base de datos activa en relación a la variable seleccionada. Se selecciona la opción Insertar Registro. Esto permite nominar una nueva variable. Colocar el cursor en la variable donde se va a buscar el valor. Se sitúa el cursor en el registro siguiente al que se desea insertar. No elimina los registros finales vacíos permanentemente presentes. importar o generar por la opción transformación. pero los datos se deberán grabar. Buscar Busca un valor en una variable de la base de datos abierta. Pulsar el botón Aceptar y el cursor se situará en el valor encontrado. Compactar Tabla Elimina los registros vacíos intermedios de la base de datos activa. Insertar Registro Inserta un nuevo registro en la base de datos abierta.Manual G-Stat 2. Esta opción sirve para insertar más de un registro a la vez. aparece un cuadro de diálogo donde se introduce el valor a buscar. Se crea el nuevo registro en blanco.0 25 Ventana Insertar Variable.

en la variable FC2FC1. . Ventana Buscar. : Identificar el registro del paciente que tiene. Si el registro no existe aparece un cuadro de diálogo que indica que el registro introducido no es válido. aparecerá un cuadro de diálogo que indica que no se ha encontrado el valor. Al pulsar el botón Aceptar se seleccionará el registro buscado. el valor 44. Ir a Registro Busca un registro en la base de datos actual.26 valor. Aparece una ventana donde se introduce el número de orden del registro a buscar.

Dicho menú contiene las funciones básicas para el tratamiento de ficheros: Nuevo. Archivo. Transformar Permite generar variables mediante la transformación de variables numéricas ya creadas. Para imprimir los resultados del programa. La transformación puede estar compuesta por una variable y un número. aparece un recuadro con todas las variables cuantitativas de la base de datos.Manual G-Stat 2. Las transformaciones sobre datos faltantes (“missing”) dan un resultado faltante. se puede copiarlos previamente al editor o usar directamente el botón Imprimir en los resultados. Guardar como. En la ventana Transformar. Imprimir y Salir. modificar los datos mediante transformaciones y recodificaciones. La o las variables que se utilizan para la transformación se llevarán a los recuadros blancos. Este menú contiene las opciones: abrir un editor de textos independiente. Insertar.0 27 Menú Utilidades Activar la opción Utilidades del menú principal o mediante Alt+U. Esta utilidad es similar al editor de texto del sistema operativo. . Guardar. Editor de texto Abre el editor de texto del programa. incluso aunque las celdas destino estuviesen previamente rellenas. realización de filtros de la base de datos y un ejemplo. Al seleccionar esta opción aparece el editor de texto del programa con un único menú. Se elige el operador a utilizar del menú de los operadores y se identifica la variable. Abrir.

Definidas las modificaciones. El resultado será la variable FC1+FC2. Recodificar Permite cambiar automáticamente uno o varios valores. tanto numéricos como alfanuméricos. que puede ser tanto cuantitativa como cualitativa.28 : Anteriormente se ha creado la variable FC1+FC2. Colocar el cursor en la variable a recodificar. ahora se desea rellenarla con la suma de las variables FC1 y FC2. Para que el programa considere todas las modificaciones hay que mover el cursor a otra celda después de la última entrada. pulsar el botón Aceptar. En la columna Después se pueden ir definiendo las modificaciones de los valores o eliminarlos si se desea. . Cuadro de diálogo Transformar. donde inicialmente aparecen los mismos valores. Aparece la ventana de recodificar compuesta por dos columnas: Antes. de una variable. con los diferentes valores de la variable a recodificar y Después.

pero en la base de datos aparece esta variable codificada en 1 y 2. . Ventana de la opción recodificar. Se filtrarán los datos según esta condición. Se recodificará la variable de forma que donde antes había un 1 se introduce un 0 y donde había un 2 se introduce un 1. Se selecciona la variable. la condición lógica utilizada para filtrar los datos y el valor del filtro. Pulsar Aceptar para finalizar.6 años. : Se desea realizar un subestudio sólo con las personas mayores de 22. Filtrar Datos Permite seleccionar individuos a partir de un rango específico correspondiente a una variable. Seleccionada la opción se muestra la ventana para filtrar datos.0 29 : Se desea codificar la variable Sexo en 0 y 1.Manual G-Stat 2.

30 Ventana de filtrar datos mediante la variable Edad. 2=no Edad en años Frecuencia cardiaca antes del ejercicio Frecuencia cardiaca después del ejercicio Incremento de la frecuencia cardiaca Nivel de entrenamiento físico 1. Seleccionada la opción Ejemplo aparece el cuadro de diálogo de guardar.gst. Ejemplo Abre una base de datos que contiene variables de diferentes tipos y permite la realización de casi todas las técnicas y análisis estadísticos del programa. 2=Fármaco2 Los datos son ficticios pero plausibles. El fichero es pulsofar6. 2=Mujer 1=sí. aunque aún no se haya abierto ninguna base de datos. . y se encuentra en la carpeta de instalación del programa. Las variables incluidas son: IB: Sexo: Fumador: Edad: FC1: FC2: FC2FC1: Status: Farmaco: Número de identificación 1=Hombre. El fichero contiene 40 registros correspondientes a otros tantos sujetos. 2 ó 3 1=Fármaco1. El ejemplo incorporado en el programa se utiliza en este manual.

Los códigos (a) o (b) indican que este tipo de gráficos son adecuados para variables cualitativas y los códigos (y) o (x) para variables cuantitativas. Las opciones de este menú están separadas en dos grupos: gráficos univariantes y gráficos bivariantes. Opciones y Ayuda. Barras (a) Crea un gráfico de barras para una variable cualitativa o discreta. Las pantallas de gráficos tienen cuatro botones: Guardar. . El orden y el color de las barras dependen de la disposición. Manejo del programa Identificar la variable a analizar y activar la pestaña Barras donde aparece el gráfico de barras en una nueva ventana. La separación por barras verticales indica un modelo que asume que las variables a la izquierda de la barra representan las variables explicativas o independientes y a la derecha la variable respuesta o dependiente. Este menú contiene las opciones necesarias para la realización de gráficos.Manual G-Stat 2. Imprimir. Los gráficos de barras se construyen de forma que la longitud / altura de la barra corresponde a la frecuencia absoluta para cada uno de los niveles de la variable.0 31 Menú Gráficos Activar la opción Gráficos del menú principal o mediante Alt+G.

Normalmente. La altura de cada bloque en el histograma depende del número de casos en cada clase. Gráfico de barras de la variable Sexo del Ejemplo. el título del eje X. mínimo. como paso previo. En la pestaña Histograma se encuentra la ventana con el histograma de la variable. : Obtener la distribución por sexos de la base de datos del ejemplo. máximo e incremento. Histograma (y) Crea un histograma para una variable cuantitativa. . relativa/porcentajes). En un histograma se puede ver claramente cuál es la distribución de los datos. orientación del gráfico. El histograma. para el número de clases del histograma se toma la raíz cuadrada del número de casos.32 Opciones: .La cabecera. su escala (absoluta/frecuencias. Manejo del programa Identificar la variable a analizar. discretiza los valores de la variable en un número manejable de clases.

. Histograma de la variable Edad. y la mediana corresponde a la línea central. representando una serie de medidas de centralización. media y . El programa no admite más de 12 clases. los títulos de los ejes X e Y. respectivamente. La distancia entre ambos valores.Número de clases en el que se quiera discretizar la variable: Por defecto 5. Cuando la línea de la mediana se superpone con alguna línea de los cuartiles. y dos segmentos horizontales situados a ambos lados de ésta. La media aparece señalada con un cuadrado gris y suele encontrarse próxima a la mediana. Cuando la variable es simétrica. aporta información en cuanto a la simetría o asimetría de la variable. Los bordes de la caja representan los cuartiles 1º y 3º. figura rectangular. : Obtener el histograma de la variable Edad con 8 clases. Su estructura está formada por una caja.0 Opciones: 33 . el mínimo y máximo del eje X. Cajas (y) El diagrama de cajas es un gráfico que muestra la distribución de una variable cuantitativa.La cabecera. no es posible distinguirla.Manual G-Stat 2.

Manejo del programa Identificar la variable a analizar. título. representado en el eje X. mínimo. pudiendo modificarse la relación entre longitud y anchura de la ventana mediante la posición del extremo inferior derecho. los segmentos son simplemente el mínimo y el máximo. Se representa los valores de la variable seleccionada en el eje Y. En el caso de que no haya valores extremos. La serie predicha se representa como Y^. La distancia entre estas dos medidas indica. Series Temporales (y) Crea una serie temporal teórica basada en los datos de una variable tiempodependiente. El nombre de la variable aparece en el gráfico.34 mediana coinciden.La cabecera. Los extremos de los segmentos corresponden al mínimo y al máximo de los valores sin considerar los valores extremos.5 veces la distancia intercuartílica (diferencia entre el tercer y primer cuartil) son considerados “outliers” o valores extremos y están señalados en rojo. El ECM viene dador por ECM = 1 ∑ e2 con e t = yt − y t ˆ t n . Este gráfico es autoescalable. En la gráfica se presenta el ECM (Error Cuadrático Medio). Posicionando el cursor en cada punto aparecen las coordenadas. la posibilidad de valores extremos ya que la media es considerablemente sensible a ellos y la mediana no. Los valores que estén situados a una distancia superior a 1. En la pestaña Cajas aparece el gráfico de cajas de la variable seleccionada. que se interpreta como una medida del error en la predicción. Opciones: . Se asume que los valores de la variable representada en el gráfico están ordenados y que éstos están igualmente espaciados en el tiempo. A menor valor del ECM mejor es la serie estimada y más se acerca la modelización a los datos reales. máximo e incremento del eje X. asimismo. orientación del gráfico.

Un valor de alfa igual a 1 indica que solo cuenta la última observación .Manual G-Stat 2.Alfa: Determina el peso dado a las observaciones ultimas en relación a las observaciones anteriores. Valores cercanos a 1 aumentan el peso relativo de las observaciones más recientes. + yt − s +1 s ˆ y t = Mt Alisado exponencial El alisado exponencial de parámetro alfa se define como ˆ y t + 1 = αy t + (1 − α )ˆ t y ˆ y1 = y1 Alisado exponencial doble de Holt-Winters El alisado exponencial doble de parámetros alfa y beta se define como Mt = α y t + (1 − α )(Mt − 1 + b t − 1 ) con M1 = y1 bt = β (Mt − Mt −1 ) + (1 − β )b t −1 con b1 = 0 ˆ y t + h = Mt + b th con: .Beta: Determina el peso dado a las observaciones ultimas en relación a las observaciones anteriores en la estimación de la tendencia de la serie. Media móvil La media móvil de parámetro s se define como Mt = yt + yt −1 + .. . Valores cercanos a 0 implican que las observaciones anteriores cuentan tanto como las más recientes.0 35 Esta serie Y^ puede ser modelizada mediante media móvil. Se define entre 0 y 1. No calcula el gráfico cuando la variable analizada tiene menos de cuatro valores. Se define entre 0 y 1. alisado exponencial y alisado exponencial doble.. Valores cercanos a 1 indican lo contrario.

: Modelizar la variable FC1 con una serie temporal de medias móviles de parámetro S=4.La cabecera. la original y la transformada. alisado exponencial de parámetro alfa y alisado exponencial de doble parámetro alfa y beta. Barras (a|b) Genera un gráfico de barras para dos variables cualitativas. mínimo. En la pestaña Serie Temporal se encuentran dos serie de datos. Es una representación gráfica de las frecuencias de las celdas en tablas de frecuencias conjuntas de dos variables cualitativas / discretas. Se identifican las dos variables en la ventana de diálogo correspondiente como variables “respuesta” y “explicativa”. Serie temporal con media móvil S=4 de la variable FC1. La variable explicativa corresponde a la . Opciones: . . título. máximo e incremento del eje Y.36 Manejo del programa Identificar la variable a analizar.Tipo de serie temporal: Media móvil de parámetro S. ambas cualitativas.

su escala (absoluta/frecuencias. mínimo. En la pestaña Cajas se encuentra el gráfico correspondiente. y otra respuesta cuantitativa (y) de la que se analizan los datos. En la pestaña Barras. orientación del gráfico. Manejo del programa Se identifica la Variable respuesta cuantitativa y la Variable explicativa cualitativa. Opciones: . Cajas (a|y) Crea un gráfico de cajas para una variable cuantitativa estratificada por una variable cualitativa. Manejo del programa Se identifica la Variable respuesta y la Variable explicativa. . Es la representación gráfica de las distribuciones de diferentes submuestras de una variable cuantitativa.0 37 variable que forma los grupos. mínimo. Opciones: . relativa/porcentajes). Las alturas de los bloques corresponden a las frecuencias de cada combinación de niveles en las dos variables. Es necesario identificar dos variables: una explicativa cualitativa / discreta (a) que es la que formará las submuestras. La variable respuesta es la que formará los bloques de frecuencias. máximo e incremento.La cabecera.Manual G-Stat 2. se encuentra el gráfico de barras bidimensional.La cabecera. Para cada nivel de la variable que forma las submuestras se presenta un diagrama de cajas. orientación del gráfico. título. : Obtener las cajas de Edad según el Sexo de los sujetos. el título del eje X. amabas cualitativas. máximo e incremento del eje X.

Opciones: . Manejo del programa Se identifica la Variable respuesta cuantitativa y la Variable explicativa cualitativa. Bloques de Medias y Desviaciones (a|y) Crea un gráfico de bloques para las medias y segmentos para las desviaciones típicas de los valores de diferentes grupos. . .Desviaciones típicas o error estándar. título de los ejes X e Y. La variable respuesta debe ser cuantitativa y la variable formadora de grupos cualitativa. : Representar las medias y desviaciones típicas de la variable Edad por grupos de Status.La cabecera. En la pestaña Bloques de Medias y Desviaciones se encuentra el gráfico. máximo e incremento del eje Y. mínimo.38 Gráficos de Cajas (a|y) de la variable Edad por Sexo.

Dispersión (x|y) Representación de la nube de puntos en ejes cartesianos de dos variables cuantitativas.Manual G-Stat 2. En la pestaña Dispersión se encuentra el gráfico de dispersión de ambas variables. .La cabecera. máximo e incremento de los ejes X e Y. títulos. Para la obtención de la recta de regresión y de sus límites confidenciales. Manejo del programa Se introduce la Variable x y la Variable y. Opciones: . acceder a los menús “Descriptiva / x|y” y “Análisis/ x|y”.0 39 Bloques de medias y desviaciones típicas de Edad por Status. mínimo.

40 .

descriptiva de variables cuantitativas. descriptiva por grupos y relación entre dos variables cuantitativas. tablas. Para una descriptiva más precisa conviene usar el menú Descriptiva / Cualitativas (a)(b) . Este menú. Están separadas en seis grupos: validación. (x) o (z) indican variables cuantitativas. El asterisco implica que los resultados se estratificarán para todas las posibles combinaciones de categorías o niveles de las variables explicativas. Validación Se presenta un resumen básico de las variables que componen el fichero de trabajo en términos de número de casos y de variables así como el número de casos válidos y casos numéricos.Manual G-Stat 2. contiene las opciones necesarias para la realización de análisis descriptivos. Esta descriptiva sirve de comprobación para detectar posibles errores en la entrada de datos. Los códigos (a) o (b) indican variables cualitativas y los códigos (y). descriptiva de variables cualitativas.0 41 Menú Descriptiva Activar la opción Descriptiva del menú principal o mediante Alt+D. mínimo y máximo.

0 EDAD 40 40 19.0 2. Frecuencias: Los principales estadísticos descriptivos para variables cualitativas son: las frecuencias absolutas y las frecuencias relativas. Barras: Gráfico de barras para una variable cualitativa.42 para variables cualitativas y el menú Descriptiva / Cuantitativas (x)(y) para variables cuantitativas.0 Cualitativa (a) Realiza la descriptiva para una variable cualitativa o discreta (a).0 SEXO 40 40 1. Ver menú Gráficos.0 165. Validación de Variables ==================================================================== Número de Casos: 40 Casos Casos Variable Válidos Numéricos Mínimo Máximo ---------------------------------------------------------IB 40 40 1. : Realizar la validación de la base de datos del Ejemplo Ventana de resultado al seleccionar validación en la base de datos del ejemplo.0 STATUS 40 40 1.0 96.0 82. Para cada categoría de la variable cualitativa se muestra el número de individuos que pertenecen a ella (frecuencias absolutas).0 FUMADOR 40 40 1.0 FARMACO 40 40 1. Manejo del programa Variables: Se identifica la Variable cualitativa o discreta a analizar. así como el porcentaje respecto al total de individuos (frecuencias relativas).0 2.6 FC1 40 40 62.0 FC2 40 40 112.0 2.0 3. .5 25.0 40.0 FC2FC1 40 40 42.

coeficiente de asimetría estandarizada. Manejo del programa Variables: Se identifican las Variables cualitativas o discretas. cuartiles. mínimo. la mediana se calcula como la semisuma de los dos valores centrales. media geométrica. máximo. Los principales estadísticos descriptivos para una variable cuantitativa son: media aritmética. varianza. En el caso de que el número de observaciones sea par. Tiene sentido en variables con pocos niveles. La moda es el valor que más se repite. La media geométrica (mg) se calcula como la raíz enésima del producto de los valores de las observaciones. coeficiente de curtosis. Frecuencias: Permite obtener una descriptiva en términos de frecuencias para varias variables cualitativas a la vez. Cuantitativa (y) Realiza la estadística descriptiva para una variable cuantitativa. con .Manual G-Stat 2. para cada categoría se muestra el número de individuos que pertenecen a ella (frecuencias absolutas). rango o amplitud. rango intercuartílico. coeficiente de asimetría. error estándar de la media. moda. así como el porcentaje respecto al total de individuos (frecuencias relativas). mediana. En cada variable. La media aritmética se calcula como la suma de los valores de las observaciones dividido por el tamaño muestral (n): i=1 x = ∑ xi n n La mediana (med) se calcula ordenando los datos de menor a mayor y tomando el valor del medio que es el que deja un 50% de observaciones a su izquierda y un 50% a su derecha. desviación típica.0 43 Cualitativas (a)(b) Realiza la descriptiva para una o varias variables cualitativas o discretas. coeficiente de curtosis estandarizada y coeficiente de variación.

Su expresión es la desviación típica dividida entre la raíz cuadrada del tamaño muestral. el máximo es el mayor valor observado y la amplitud (a veces llamada rango) es la diferencia entre el máximo y el mínimo.44 1 n n n mg = n ∏ x i =  ∏ xi    i= 1  i =1  Otra expresión para su cálculo es evaluar la exponencial de la media aritmética de los logaritmos neperianos de las observaciones. deja un 75% a su izquierda y un 25% a su derecha. El cuartil medio es la mediana. El cuartil inferior se calcula ordenando los datos de menor a mayor y tomando el valor que deja un 25% de observaciones a su izquierda y un 75% a su derecha. El mínimo es el menor valor observado. Existen tres cuartiles: cuartil inferior. El coeficiente de asimetría se calcula como 3 n 1 n ∑ x −x (n − 1)(n − 2) s3 i =1 i ( ) El coeficiente de asimetría estandarizada viene dado por asimetría 6 n El coeficiente de curtosis (apuntamiento) se calcula como . El cuartil superior es aquel valor. el programa devuelve el valor “No Aplicable” para la media geométrica. Cuando existan valores negativos. cuartil medio y cuartil superior. El rango intercuartílico es la diferencia entre el cuartil superior y el inferior. que en los datos ordenados. La varianza se calcula como s2 = 2 1 n ∑ xi − x n − 1 i =1 ( ) La desviación típica o desviación estándar s se calcula como la raíz cuadrada positiva de la varianza de forma que s = + s2 = + 2 1 n ∑ xi − x n − 1 i= 1 ( ) El error estándar de la media se utiliza para estimar una media poblacional mediante intervalos de confianza.

7.5. Si n=39 y p=50%.2. siendo p un número cualquiera entre cero y uno. Al cuartil p=0.9. 0. Manejo del programa Variables: Se identifica la Variable cuantitativa.1. 0. Los deciles son los percentiles en donde p=0.25 se le conoce como cuartil inferior o primer cuartil Q1. 0. . La mediana es el segundo cuartil Q2. 0. y donde (i) indica el valor ordenado de los valores de la variable x de menor a mayor que ocupa la posición i-ésima. Ejemplos de percentiles son los deciles y los cuartiles.6. 0.25.8. 0. Observar que si n es par. se tiene que i=10 y f=0.50.Manual G-Stat 2. al cuartil p=0. se tiene que i=19 y f=0. Los cuartiles son los percentiles en donde p=0. Por ejemplo si n=40 y p=25%. 0. 0.75 como cuartil superior o tercer cuartil Q3. 0.4.3. Sea n el tamaño muestral.75.0 4 n(n + 1) 1 n (n − 1)(n − 1) xi − x − 3 4 ∑ (n − 1)(n − 2)(n − 3) s i =1 (n − 2)(n − 3) 45 ( ) El coeficiente de curtosis estandarizada viene dado por curtosis 24 n El coeficiente de variación se calcula como s x Los percentiles son aquellos valores que dejan un p% de observaciones a un lado de su valor y un (1-p)% al otro.5. 0. la mediana (percentil 50%) se calcula como la semisuma de los dos valores centrales y que si n es impar como el valor que deja a la izquierda y a la derecha el mismo número de valores. el percentil p se calcula como: 1 2 ( x(i) + x (i+ 1) ) si f = 0 x (i+ 1) si f > 0 siendo i la parte entera de n·p y f la parte fraccional de n·p.

las relativas la proporción respecto al total. 10%.46 Estadísticos: variable. 95% y 99%. Histograma: Histograma para una variable cuantitativa. Las frecuencias absolutas indican el número de individuos para cada intervalo.E. Ver menú Gráficos. : Realizar un análisis descriptivo de la variable FC2FC1. Opciones: .0000 Moda 52. los percentiles del 1%. Clases: Con esta opción se discretiza la variable cuantitativa en distintos tramos o intervalos.7357 Mínimo 42. 25%. Cajas: Gráfico de Cajas de la variable cuantitativa. Para cada uno de ellos se suministra información en términos de frecuencias absolutas y relativas.0000 Media Geométrica 60. 5%. Ver menú Gráficos. Estadísticos de la variable FC2FC1 con la opción Cuantitativa (y). Estadísticos para la variable FC2FC1 ====================================================================== --------------------------------------Estadístico FC2FC1 --------------------------------------N 40 Media 61. 75%. Presenta los estadísticos seleccionados para esta Opciones: .7500 Mediana 61.0000 .5000 Desviación Típica 10.Seleccionar los estadísticos a visualizar: por defecto aparecen todos.Número de clases: Por defecto el programa considera 5 clases. de la Media (*) 1.9772 E.7718 Varianza 120. Percentiles: Presentan como opción por defecto.0000 Máximo 82. 90%.

00 9 33 0.0885 Coeficiente de Variación 17. Rela.82 5 74.15 0.0000 Cuartil Superior 70.0000 Asimetría -0. Clases de la variable FC2FC1 ====================================================================== Número de Casos: 40 --------------------------------------------------------------------Límite Límite Frec.Frec. Clases Inferior Superior Absoluta Acumulada Relativa Acumulada --------------------------------------------------------------------1 42.Manual G-Stat 2.32 3 58.00 74.C.00 11 24 0. Frec.0433 Curtosis -0.28 0.00 7 13 0.0000 Cuartil Inferior 53.00 6 6 0.23 0.00 50.00 66. Abs.00 82. de la media 47 Cajas de la variable FC2FC1 de la opción Cuantitativa (y).17 0.8432 Curtosis Estandarizada -1.15 2 50.0 Rango 40.60 4 66.0000 Rango Intercuartílico 17.00 --------------------------------------------------------------------- .17 1. Frec.7769 --------------------------------------(*) Usar con propósito de estimación para el I.0168 Asimetría Estandarizada -0.00 7 40 0.00 58.

0% 10. Percentiles para la variable FC2FC1 =================================================================== Número de Casos: 40 Percentiles 1.0% 75.00 70.0% 90.00 82. .00 43.0% 95.00 Cuantitativas (x)(y) Realiza la estadística descriptiva para varias variables cuantitativas.0% 5.48 Histograma de la opción Cuantitativa (y) para FC2FC1.00 53. Percentiles de la variable FC2FC1.0% 25. Manejo del programa Variables: Se identifican las Variables a analizar.00 76.0% 42.0% 99.00 47.00 80.

Matriz de coeficientes de correlación de las variables FC1.5796 (0.6437 (0.0001) 1.0000 0.0001) 0. : Se desea calcular los coeficientes de correlación de Pearson de los datos del ejemplo para las variables FC1.Manual G-Stat 2. Se detallan en Cuantitativa (y). FC2 y Edad.5796 (0.0000 0. Correlaciones ========================================================================= Variables : FC1.2537) -0.0000 (0.6437 1.0001) FC2 0. Cuantitativas (x)(y). variables cualitativas con datos no agrupados y .1848 -0.2537) (0.0001) ------------------------------------------- EDAD Tablas (a|b) Contiene un submenú para agrupados.1848 (0. FC2 y Edad. Ver Descriptiva / x|y / Modelo para las definiciones de dichos coeficientes y Análisis / x|y / Modelo para ver cómo se calculan sus significaciones. EDAD Número de Casos : 40 r de Pearson (Significación) FC1 FC2 EDAD ------------------------------------------FC1 1.0 49 Estadísticos: Estadísticos de las variables seleccionadas. Correlaciones: Matriz de correlaciones de Pearson y Spearman de las variables seleccionadas considerando los casos válidos. FC2.

coeficiente de incertidumbre asimétrico Uasim y Dasim de Somer asimétrico. lambda asimétrica λasim y coeficiente de incertidumbre asimétrico Uasim. Estas frecuencias absolutas se pueden relativizar respecto al total de cada nivel en cada variable (porcentaje de filas y columnas) o respecto al total de individuos (porcentaje total). lambda simétrica λsim. Los estadísticos con modelo que se tratan son: lambda asimétrica λasim. . En las tablas de contingencia. En el caso de que las dos variables sean cuantitativas se muestran todos los estadísticos considerados. se recoge la frecuencia absoluta del número de individuos para cada una de las posibles combinaciones de niveles de las dos variables.50 Tablas (a|b) à Tablas Presenta una tabla de contingencia para dos variables cualitativas o discretas y los estadísticos descriptivos asociados. coeficiente de contingencia C. Tau-c de Stuart y Dsim de Somer simétrico. coeficiente de incertidumbre simétrico Usim. Se muestran los principales estadísticos de asociación entre dos variables cualitativas: los estadísticos de asociación y los estadísticos con modelo. En el caso de que haya al menos una variable cualitativa sólo se muestran los siguientes estadísticos: V de Cramer. coeficiente de contingencia C. Tau-b de Kendall. en columnas=var X Var. coeficiente de incertidumbre simétrico Usim. Gamma de Goodman-Kruskal γGk . en filas=var Y Niv1 Niv2 … Nivr Total Cat1 n 11 n 21 … n r1 c1 Cat2 n 12 n 22 … n r2 c2 … … … … … … Catc n 1c n 2c … n rc cc Total r1 r2 … rr n Los estadísticos de asociación que se tratan son: V de Cramer. lambda simétrica λsim. La notación que se sigue es la de una matriz con r filas y c columnas donde: Var.

Manual G-Stat 2. Coeficiente de contingencia C C=+ χ2 χ2 + n Lambda simétrica λ sim λ sim = ∑ máx nij + ∑ máx nij − máx c j − máxri i j j i j i 2n − máx c j − máxri j i Coeficiente de incertidumbre simétrico Usim Usim = 2[H(x) + H(y) − H( xy)] con [H(x) + H(y)] H( x) = − ∑ c ri  ri  Ln    i=1 n  n r H(y) = − ∑ r  cj  Ln  n  j =1 n   cj c H( xy) = − ∑ ∑ i= 1 j =1 nij  nij  Ln  n n   Gamma de Goodman-Kruskal γ Gk γGK = P'−Q' con P'+Q' i j P' = ∑ ∑ nijAij . c − 1} χ2 donde χ2 es el valor del estadístico de contraste Chi-Cuadrado para una tabla de dimensiones r x c (ver Análisis / Tablas (a|b) / Chi-Cuadrado / ChiCuadrado).0 V de Cramer 51 V=+ n mín {r − 1.

c} Coeficiente D de Somer simétrico Dsim = 2 ⋅ P'− Q' con wr + wc i wr = n2 − ∑ ri2 wc = n − ∑ c j j 2 2 Lambda asimétrica λ asim Suponiendo que la variable fila es la variable respuesta. es ∑ máx nij − máx ri λ asim = j i i n − máxri i y suponiendo que la variable columna es la variable respuesta. es .52 Aij = ∑ ∑ nkl + ∑ ∑ nkl k > il> j k < il< j Q' = ∑ ∑ nijDij i j Dij = ∑ ∑ nkl + ∑ ∑ nkl k >il < j k <il > j Tau-b de Kendall τb P'−Q' n(n − 1) − r (r − 1) n(n − 1) − c c − 1  ∑ i i ∑ j j    i j    τb = ( ) Tau-c de Stuart τc τc = P'− Q' 2 m −1 n m con m= mín {r.

Manual G-Stat 2.0

53

λ asim =

∑ máx nij − máx c j
i j j

n − máx c j
j

Coeficiente de incertidumbre asimétrico Uasim Suponiendo que la variable fila es la variable respuesta, es

Uasim =

H(x) + H(y) − H( xy) H(x)

y suponiendo que la variable columna es la variable respuesta, es

Uasim =

H(x) + H(y) − H( xy) H(y)

Coeficiente D de Somer asimétrico Suponiendo que la variable fila es la variable respuesta, es Dasim = P'−Q' wc

y suponiendo que la variable columna es la variable respuesta, es Dasim = P'−Q' wr

Manejo del programa Variables: Se identifica la Variable que aparecerá en filas y la Variable que aparecerá en columnas. Tablas: Se muestra la tabla de contingencia de dos variables cualitativas. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Adicionalmente, se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila), en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). El programa calcula, por defecto, los porcentajes referidos al total de la tabla.

54 Estadísticos: Se muestran los principales estadísticos de asociación entre dos variables cualitativas: V de Cramer Coeficiente de Contingencia Lambda simétrica Coeficiente de incertidumbre simétrico Gamma de Goodman-Kruskal Tau-b de Kendall Tau-c de Stuart D de Somer simétrico También se presentan los siguientes estadísticos descriptivos cuando se asume un modelo Lambda asimétrica Coeficiente de incertidumbre asimétrico D de Somer asimétrico Barras: Representación gráfica de las frecuencias de las celdas en tablas de frecuencias conjuntas de dos variables cualitativas /discretas. Se identifican las dos variables en la ventana de diálogo correspondiente como variables “fila” y “columna”. La variable fila corresponde a la variable que forma los grupos. La variable columna es la que formará los bloques de frecuencias. Las alturas de los bloques corresponden a las frecuencias de cada combinación de niveles en las dos variables. Opciones: - La cabecera, orientación del gráfico, el título del eje X, su escala (absoluta/frecuencias, relativa/porcentajes), mínimo, máximo e incremento.

Tablas (a|b) à Tablas. Datos agrupados
A partir de datos agrupados se calculan los estadísticos descriptivos asociados para dos variables cualitativas o discretas. Los datos agrupados se introducen directamente en una cuadrícula en forma de tabla de r filas y c columnas. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero.

Manual G-Stat 2.0 Manejo del programa

55

Datos Agrupados: La cuadrícula permite la entrada directa de las frecuencias. Se puede definir el número de categorías o niveles de las dos variables mediante el número de filas y columnas. Por defecto aparecen unos valores que deben ser sustituidos por los datos del usuario. No dejar filas o columnas con valores faltantes o con todos los valores cero. El Botón "Crear Tabla" prepara la estructura de la tabla ajustada al número de filas y columnas definido. La tabla no admite valores negativos, decimales o alfanuméricos. Tablas: Se muestra la tabla de contingencia de dos variables cualitativas. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Adicionalmente, se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila), en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). El programa calcula, por defecto, los porcentajes referidos al total de la tabla. Estadísticos: Se muestran los principales estadísticos de asociación entre dos variables cualitativas: V de Cramer Coeficiente de Contingencia Lambda simétrica Coeficiente de incertidumbre simétrico Gamma de Goodman-Kruskal Tau-b de Kendall Tau-c de Stuart D de Somer simétrico También se presentan los siguientes estadísticos descriptivos cuando se asume un modelo Lambda asimétrica Coeficiente de incertidumbre asimétrico D de Somer asimétrico Barras: Representación gráfica de las frecuencias de las celdas en tablas de frecuencias conjuntas de dos variables cualitativas /discretas.

56 Se identifican las dos variables en la ventana de diálogo correspondiente como variables “fila” y “columna”. La variable fila corresponde a la variable que forma los grupos. La variable columna es la que formará los bloques de frecuencias. Las alturas de los bloques corresponden a las frecuencias de cada combinación de niveles en las dos variables. Opciones: - La cabecera, orientación del gráfico, el título del eje X, su escala (absoluta/frecuencias, relativa/porcentajes), mínimo, máximo e incremento.

Tablas (a|b|c)
Presenta tablas de frecuencias para dos variables cualitativas, estratificadas por una tercera variable cualitativa que forma las capas. Permite realizar un análisis estratificado mediante varias tablas de contingencia de las variables a y b para cada uno de los valores de la variable c (la que forma las capas). En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Adicionalmente se presentan los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila), en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). Manejo del programa Variables: Se identifican las dos variables que formarán las tablas, identificando la Variable que aparecerá en filas y la Variable que aparecerá en columnas. Adicionalmente se identifica una tercera Variable cualitativa formadora de las capas o estratos. Sólo aparecen los registros completos para estas tres variables. Tablas: Aparece el número total de casos válidos no faltantes y varias tablas cruzadas de las variables seleccionadas en filas y columnas, para cada nivel de la variable en capas. En las tablas aparecen las frecuencias absolutas y los porcentajes por filas, columnas o por totales. El programa calcula, por defecto, los porcentajes referidos al total de la tabla.

4902 9.0000 Máximo 96. Cajas: Gráfico de Cajas de la variable respuesta para los distintos valores de la variable explicativa. Sólo se utilizan los registros completos para estas variables. : Descriptiva de la variable FC1 según el tipo de Fármaco que se ha administrado.0000 Varianza 90.0000 73.3675 0.9167 ------------------------------------------------- .0 20. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa cualitativa.8296 Mínimo 62.8000 76.0000 Cuartil Inferior 68.5200 12.0000 68.0 57 Grupos (a|y) Realiza una descriptiva para una variable cuantitativa.0000 96.0000 62. Estadísticos de la variable FC1 por Farmaco mediante la opción Grupos (a|y).0 Media 75.7484 Curtosis Estandarizada -0. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa.8821 Coeficiente de Variación 12. Ver menú Gráficos. Se detallan en Cuantitativa (y).1000 Mediana 75. Estadísticos para la variable FC1 por FARMACO ====================================================================== ------------------------------------------------Grupo 1 2 ------------------------------------------------N 20. estratificada por otra variable cualitativa o discreta.0000 85.0632 96.6211 Desviación Típica 9.Manual G-Stat 2.2461 -0.0000 Cuartil Superior 80.0000 Asimetría Estandarizada 1.

y las variables explicativas cualitativas a y b formadoras de grupos.58 Cajas de la variable FC1 estratificada por la variable Farmaco mediante la opción Grupos (a|y). Se detallan en Cuantitativa (y). Manejo del programa Variables: Se identifica la variable respuesta cuantitativa. Sólo se utilizan los registros completos para estas variables. Grupos (a*b|y) Descriptiva para una variable cuantitativa y estratificada por todas las posibles combinaciones de niveles de las variables cualitativas a y b. . Estadísticos: Estadísticos de la variable seleccionada para cada posible categoría de las variables cualitativas combinadas.

3871 19.0211 21.5833 1.5000 25.5000 1 22 22.3583 1.4449 20.1 10 22.4380 19.5000 25.8083 1.5000 1.6000 -------------------------------------------------------------SEXO Desviación FUMADOR N Media Típica Mínimo Máximo --------------------------------------------------------------2.5000 25.5486 19.6000 --------------------------------------------------------------- .9333 1.2 12 22.0000 22.5000 25.6000 1.6000 -----------------------------------------------------------Total 40 22.1555 20.4000 --------------------------------------------------------------Total 40 22.4150 1.1000 24.0000 24.0 59 : Descriptiva de la variable Edad según las variables Sexo y Fumador.8100 1. Resultados de la descriptiva de una variable cuantitativa por subgrupos formados por dos variables cualitativas.4000 -------------------------------------------------------------Total 40 22.4380 19.6000 1 16 22.6000 -----------------------------------------------------------Desviación FUMADOR N Media Típica Mínimo Máximo -------------------------------------------------------------2 24 22.5000 25.8091 1.4150 1.0000 25.5000 25.0833 0.4380 19.4150 1.1625 1.9725 20.5000 25.5000 2.6941 19. FUMADOR 40 Desviación SEXO N Media Típica Mínimo Máximo -----------------------------------------------------------2 18 21.Manual G-Stat 2. Grupos (a*b|y) Estadísticos =========================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: EDAD SEXO.1 6 21.2 12 22.5209 20.

FC2 para los diferentes grupos de Fármacos. .60 Grupos (a*b*c|y) Realiza una descriptiva para una variable cuantitativa (y) estratificada por todas las posibles combinaciones de niveles de las variables cualitativas (a). Estadísticos: Estadísticos de la variable respuesta para cada posible combinación de las categorías de las tres variables cualitativas. (y). Sólo se utilizan los registros completos para estas variables. Se detallan en Cuantitativa (y). Resultados de la descriptiva de varias variables cuantitativas por subgrupos formados por una variable cualitativa. (z) estratificadas por una variable cualitativa o discreta formadora de los grupos (a). : Descriptiva de Edad. (b) y (c). Estadísticos: Estadísticos de las variables respuesta según las categorías de la variable explicativa. FC1. Manejo del programa Variables: Se identifican la Variable respuesta cuantitativa y las Variables explicativas cualitativas que forman los grupos. Se detallan en Cuantitativa (y). Manejo del programa Variables: Se identifica la Variable explicativa cualitativa y las Variables respuesta cuantitativas. Grupos (a|xyz) Presenta la descriptiva de diferentes variables cuantitativas (x).

0000 158.4902 62. El modelo que se asume es: y = β 0 + x β1 + ε Los coeficientes β 0 y β 1 se estiman por b0 (ordenada en el origen) y por b1 (pendiente) a través del método de mínimos cuadrados: .3435 116.0000 13.1000 73.0000 2 20 76.0000 -------------------------------------------------------------------------Total 40 75.1500 1.0000 96.5379 62.5500 1.6000 Variable=FC1 Desviación FARMACO N Media Mediana Típica Mínimo Máximo -------------------------------------------------------------------------1 20 75.0000 13.2300 22.0000 9.0000 24.4150 22.9000 -------------------------------------------------------------------------Total 40 22.4380 19.0000 165.0000 2 20 138.0000 x|y Realiza una descriptiva bivariante de dos variables cuantitativas.6588 19.0000 96.8296 62.5000 25.6000 22.0000 -------------------------------------------------------------------------Total 40 137.0 Grupos (a|xyz). FC1.1921 20.9500 74.0000 165.0000 9.0000 9.9500 137.7000 137.8000 75.0000 13.5199 112.6000 2 20 22.2804 112. FC2 Número de Casos: 40 Nota: Sólo se consideran los registros (casos) con información completa en todas las variables analizadas Variable=EDAD 61 Desviación FARMACO N Media Mediana Típica Mínimo Máximo -------------------------------------------------------------------------1 20 22. Estadísticos ====================================================================== Variable que forma los grupos : FARMACO Variable(s) : EDAD.Manual G-Stat 2.8000 1.5000 25.4500 137.0000 Variable=FC2 Desviación FARMACO N Media Mediana Típica Mínimo Máximo -------------------------------------------------------------------------1 20 136.0000 96.

la ecuación resultante dada por el modelo de regresión lineal simple es ˆ y = b0 + b1x donde ^y indica el valor que predice el modelo para la variable respuesta a partir de la información de la variable explicativa. b0 = y − b1 x 1 n 1 n ∑ xi . s y = ∑ yi − y n − 1 i =1 n − 1 i =1 ( ) ( ) s2 = xy 1 n ∑ xi − x yi − y n − 1 i=1 ( )( ) Por tanto. Los errores estándar (EE) de los coeficientes del modelo se calculan a partir de la desviación típica residual.62 s2 xy s2 x b1 = donde x = s2 = x . Los residuos se calculan como la diferencia que hay entre la variable respuesta original y la que predice el modelo. con lo que se = 1 ∑ e2 n− 2 Se divide por n .2 en lugar de por n – 1 para obtener una estimación mejor de la desviación típica residual poblacional. y = ∑ yi n i =1 n i =1 2 2 1 n 1 n 2 ∑ xi − x . de forma que EE(b 0 ) = s e 1 + n i=1 ∑ xi − x n ( x 2 ) 2 . es decir: ˆ residuos = e = y − y La desviación típica residual se calcula como se = 2 1 ∑ e−e n−2 ( ) Se puede demostrar que la media de los residuales es cero.

El coeficiente de determinación también se puede calcular como el cuadrado del coeficiente de correlación de Pearson. no implica que no haya otro tipo de asociación no lineal (como por ejemplo curvilínea o senoidal).Manual G-Stat 2. es adimensional y está íntimamente relacionado con la desviación típica residual.0 EE(b1 ) = se 63 i=1 ∑ xi − x n ( 1 ) 2 Una medida global de bondad del modelo es el coeficiente de determinación R2 (“R-Cuadrado”). R2 en tanto por ciento representa el porcentaje de información que explica el modelo. El coeficiente de correlación r de Pearson está dado por r = sxy sxsy 2 El coeficiente de correlación de Spearman es el análogo no paramétrico al coeficiente de correlación de Pearson. Por otra parte correlación no implica causalidad. El coeficiente de correlación de Pearson requiere normalidad en las variables. A continuación. El coeficiente de correlación de Pearson está comprendido entre –1 y +1. a los que se denota por: Ri(Var1) y R(Var2). se calculan los rangos de los valores de éstas. Conviene señalar que correlación implica asociación lineal. siendo R(Var1) los rangos de Var1 asociados al i i individuo i y Ri(Var2) los rangos de Var2 asociados al individuo i. ya que utiliza los rangos de las variables y puede ser utilizado para variables ordinales o incluso dicotómicas o para variables cuantitativas con muestras pequeñas. El coeficiente de determinación se calcula como R2 = SCM SCT donde SCM es la suma de cuadrados del modelo y SCT la suma de cuadrados total (ver expresiones en Análisis / x|y / Regresión Lineal Simple / Anova). Para calcular el coeficiente de correlación de Spearman entre dos variables Var1 y Var2. se realizan los siguientes cálculos intermedios: D = ∑ (Ri (Var1) − Ri (Var2 )) i=1 n 2 Tx = Ty = ∑ nº empates − nº empates empates en Var1 ( 3 ) ∑ nº empates − nº empates empates en Var2 ( 3 ) .

Opciones: . Estadísticos de la variable FC2 y Edad. se calcula el coeficiente de correlación rs de Spearman dado por rS = A +B−D 2 AB Se puede demostrar que si se calcula el coeficiente de correlación de Pearson sobre las variables Ri(Var1) y Ri(Var2) se llega al mismo resultado. Modelo: Se presentan los coeficientes de la recta de regresión lineal de mejor ajuste por el método de mínimos cuadrados. Desviación Típica de Residuos y Rho de Spearman. También se calculan los siguientes estadísticos: r de Pearson. máximo e incremento de los ejes X e Y. B = 12 12 A= A partir de los coeficientes calculados con anterioridad. Manejo del programa Variables: Se identifican las dos Variables cuantitativas X e Y. Estadísticos ====================================================================== Variable Y: EDAD Variable X: FC2 Número de Casos: 40 ------------------------------------------ . Se detallan en Cuantitativa (y).64 3 n − n − Ty n3 − n − Tx . Recta de Ajuste: Presenta la recta de regresión estimada por mínimos cuadrados. r cuadrado. Estadísticos: Estadísticos de las variables seleccionadas. Regresión Lineal Simple.La cabecera. títulos. mínimo. : Estudiar la relación lineal de las variable FC2 y Edad.

0697 0.0000 19.4150 Mediana 137.43% 1.0000 22. E.8595 Pendiente -0.4380 Mínimo 112.0000 6. Modelo de EDAD con FC2 ==================================================================== Número de Casos: 40 Modelo: Lineal -------------------------------Ecuación: EDAD = 32.0000 25. -------------------------------Ordenada 32.6000 Rango 53.0.1149 -0.6594 Gráfico de dispersión y recta de ajuste de Edad frente a FC2.7000 22.0697 * FC2 -------------------------------Coef.5500 Desviación Típica 13.0134 -------------------------------r de Pearson (coeficiente de correlación): r cuadrado (coeficiente de determinación): Desviación Típica de los Residuos: Rho de Spearman: -0.E.0126 1.0126 .2804 1.0 Variable FC2 EDAD -----------------------------------------N 40 40 Media 137.1000 ------------------------------------------ 65 Modelo y Coeficientes de regresión y correlación de Edad por FC2. .Manual G-Stat 2.5000 Máximo 165.6437 41.

66 .

Consta del siguiente submenú: Normal. t-Student. t-Student Inversa. mediante esta opción. Asimismo. F Inversa. F. Rango Estudentizado y Shapiro-Wilk. tanto para variables cualitativas como cuantitativas. se presenta una opción con los cálculos de las distribuciones teóricas de probabilidad directas e inversas. Rango Studentizado Inversa y Shapiro-Wilk. se pueden obtener las probabilidades asociadas a las siguientes distribuciones teóricas: Normal. Normal Inversa. Este menú contiene fundamentalmente las pruebas estadísticas univariantes y bivariantes. F. t-Student. Chi-Cuadrado. Distribuciones A partir del valor de los estadísticos y de los grados de libertad. Chi-Cuadrado Inversa.0 67 Menú Análisis Activar la opción Análisis del menú principal o mediante Alt+L. Donde es apropiado se consideran las funciones unilaterales o bilaterales. . Los códigos (a) o (b) indican que el análisis ha sido diseñado para variables cualitativas y los códigos (y) o (x) para variables cuantitativas. Inversamente se pueden obtener los valores de los estadísticos a partir de valores de probabilidad.Manual G-Stat 2. Chi-Cuadrado.

05 p − valor unilateral = 1 . 96) = 0.05 se tiene que: z − valor bilateral = 1 .96 se tiene que: p − valor bilateral= 2 ⋅ Prob N (0.96 que verifica 2 ⋅ Prob N(0.1) ≥ 1.1) ≥ 1. ) ≥ 1.96 ) = 0.0250 1 Distribuciones à Normal Inversa Para un valor alfa se calcula el correspondiente valor z bilateral y unilateral correspondiente a una distribución normal.1) ≤ 1.0421 para 20 grados de libertad. Por ejemplo. . Por ejemplo. para t=-0.05 p − valor unilateralizquierda = Prob( N(0. 0750 = 0.68 Distribuciones à Normal Para un valor z de una distribución normal se calcula el p-valor bilateral. el p-valor unilateral izquierdo y el p-valor unilateral derecho.9412 ) ) p − valor unilateral izquierda = Prob tg ≤ − 0.0750 ( ) = 0.9750 p − valor unilateralderecha= Prob( N (0. para z=1. para α=0.6449 que verifica Prob( N(0.96 ( ) = 0. 96 = 0.0750 y g=15 se tiene que: p − valor bilateral = 2 ⋅ Prob tg ≥ − 0. el pvalor unilateral izquierdo y el p-valor unilateral derecho. 6449) = 0.5294 ( ( : Calcular la probabilidad asociada al valor del estadístico t- Student = 2. 0750 = 0 .1) ≥ 1. Por ejemplo. 4706 p − valor unilateral derecha = Prob tg ≥ − 0.05 ( ) Distribuciones à t-Student Para un valor t de una distribución t-Student con g grados de libertad se calcula el p-valor bilateral. Resultados de la opción t-Student.

7530 = 0. Por ejemplo.Manual G-Stat 2.05 t − valor unilateral = 1 .1314 que verifica 2 ⋅ Prob tg ≥ 2.0250 ) (χ 2 g ) Distribuciones à Chi-Cuadrado Inversa Para un valor alfa se calcula el correspondiente valor Chi-2 unilateral derecha alfa/2 y unilateral derecha alfa correspondiente a una distribución ChiCuadrado con g grados de libertad.0228 = 0.0228 = 0.7530 que verifica Prob tg ≥ 1 . para α=0.0273 69 Distribuciones à t-Student Inversa Para un valor alfa se calcula el correspondiente valor t bilateral y unilateral correspondiente a una distribución t-Student con g grados de libertad. para Chi-2=19.0 t-Student ====================================================================== Para t = 2.05 y g=9 se tiene que: Chi − 2 − valor unilateral derecha alfa / 2 = 19. Por ejemplo.0228 que verifica 2 ⋅ Prob χ2 ≥ 19.1314 = 0.9750 ≥ 19.0228 y g=9 se tiene que: p − valor unilateralizquierda = Prob p − valor unilateralderecha= Prob (χ 2 g ≤ 19.0546 p-valor unilateral izquierda = 0. para α=0.05 y g=15 se tiene que: t − valor bilateral = 2 .9727 p-valor unilateral derecha = 0.9190 que verifica ( ) .0228 = 0.0421 y gl = 20 p-valor bilateral = 0.05 g Chi − 2 − valor unilateral derecha alfa = 16 . Por ejemplo.05 ( ) ( ) Distribuciones à Chi-Cuadrado Para un valor Chi-2 de una distribución Chi-Cuadrado con g grados de libertad se calcula el p-valor unilateral izquierdo y el p-valor unilateral derecho.

5000. Resultados de la opción Chi-Cuadrado Inversa. se calcula el p-valor unilateral izquierdo y el p-valor unilateral derecho. gln=6 y gld=9 se tiene que: p − valor unilateralizquierda = Prob p − valor unilateral derecha = Prob ( Fgln. Por ejemplo. 9190 = 0.05 y 17 grados de libertad.3197) = 0. gln = 12 y gld = 2 p-valor unilateral izquierda = 0.0500 y gl = 17 Chi-2-valor unilateral derecha alfa/2 = 30.3197.5 para 12 y 2 grados de libertad.1960 Distribuciones à F Inversa Para un valor alfa se calcula el correspondiente valor F unilateral derecha alfa/2 y unilateral derecha alfa correspondiente a una distribución F con gln grados de . gld ≤ 4. Resultados de la opción F.9750 ( Fgln. F ====================================================================== Para F = 4. 05 ) : Calcular el valor del estadístico Chi-Cuadrado para una probabilidad de 0.8040 p-valor unilateral derecha = 0. para F=4.70 Prob (χ 2 g ≥ 16.5871 Distribuciones à F Para un valor F de una distribución F con gln grados de libertad del numerador y gld grados de libertad del denominador. gld ≥ 4. Chi Cuadrado Inversa =========================================================================== Para alfa = 0.1910 Chi-2-valor unilateral derecha alfa = 27.3197) = 0.0250 : Calcular la probabilidad de un valor del estadístico F=4.

10. Por ejemplo para W=0. ( ≥ 3 . 3272 .2704 Distribuciones à Shapiro Wilk Para un valor W del estadístico y un tamaño muestral n se calcula el p-valor de la distribución Shapiro-Wilk.8774 Para α=0. para α=0.0 71 libertad del numerador y gld grados de libertad del denominador.05.05 ) Distribuciones à Rango Estudentizado Inversa Para un valor alfa se calcula el valor Rango Estudentizado unilateral correspondiente a una distribución Rango Estudentizado con gln los grados de libertad del numerador y gld los grados de libertad del denominador. gln=10 y gld=3 se tiene que: Rango Estuden. Por ejemplo. 3197) = 0. 05 gld F − valor unilateral derecha alfa = 3 .3738 = 0 .9552 y n=15 se tiene que: p − valor = 0. 3197 que verifica 2 ⋅ Prob ( Fg ln.1. El valor de alfa debe ser para esta opción superior o igual a 0. Por ejemplo para α=0.01 y menor o igual que 0.05.3738 que verifica Prob Fgln. gln=10 y gld=3 se tiene que: Rango Estuden. unilateral = 3 . unilateral = 3 . gld ≥ 4. gln=6 y gld=9 se tiene que: F − valor unilateral derecha alfa / 2 = 4.Manual G-Stat 2.

En el caso de que se esté estudiando una única variable y que ésta sea dicotómica. Se incluyen las siguientes pruebas: z-proporción y zproporción para datos agrupados. mientras que el valor de cero se reserva para el suceso complementario. Por este motivo. Los intervalos de confianza calculados del modo descrito anteriormente pueden dar lugar a límites sin sentido fuera del intervalo [0 . de forma que para α = 0. Este valor se encuentra tabulado. se expresa una proporción mediante la fórmula: ˆ p= i =1 ∑ xi n n El intervalo de confianza de una proporción se calcula como ˆ ˆ p ∈ p ± z1−α / 2EE(p) donde ˆ EE p = [ ] () ˆ1 − p ˆ p n ( ) es el error estándar de una proporción y z 1-α/2 representa el valor de la abscisa en una curva de una distribución normal que deja a la izquierda de su valor un área de 1 . es recomendable codificar dicha variable con unos y ceros. 1] en el caso de que se esté trabajando con proporciones extremas cercanas a uno o a cero. por ejemplo Curación. Cualitativa (a) à Una proporción Realiza el intervalo de confianza del parámetro poblacional proporción y un contraste de hipótesis de una proporción mediante la prueba z-proporción. . Utilizando esta codificación. como por ejemplo el método exacto de Clopper-Pearson.72 Cualitativa (a) Abre un submenú con diferentes técnicas estadísticas para una variable cualitativa dicotómica. El valor uno se suele reservar para el código con el que se quiere designar la ocurrencia del suceso de interés.96.α/2 y a la derecha un área de α/2. por ejemplo No Curación. existen métodos más precisos y al mismo tiempo más complejos para calcular los intervalos de confianza para una proporción.05 se tiene que z 1-α/2 = 1.

Para llevar a cabo este contraste se construye el estadístico de contraste experimental z dado por z= p 0 (1 − p 0 ) n ˆ p − p0 que bajo la hipótesis nula sigue una distribución normal. por ejemplo. se tiene que plantear el problema en términos de 0 contraste de hipótesis. sólo se considera el p-valor como el área bajo la curva normal a la derecha de z (sin considerar el valor absoluto). Para cada categoría de la variable cualitativa se muestra el número de individuos que pertenecen a ella (frecuencias absolutas). Frecuencias: Los principales estadísticos descriptivos para variables cualitativas son: las frecuencias absolutas y las frecuencias relativas. Para contrastes unilaterales del tipo: H0: p = p 0 H1: p > p 0 se calcula z como antes. así como el porcentaje respecto al total de individuos (frecuencias relativas). que la proporción en la población sea un determinado valor p . En cualquier caso si n<=50 se utiliza el método exacto y en caso contrario el asintótico.Manual G-Stat 2. donde: H0: p = p 0 H1: p ≠ p 0 siendo H0 la hipótesis nula y H1 la hipótesis alternativa. . pero a la hora de calcular el p-valor.0 73 En el caso de que se esté interesado en dar afirmaciones acerca de p en términos de. En el caso de proporciones extremas conviene usar el método exacto basado en la distribución binomial. Manejo del programa Variables: Identificar la variable dicotómica a analizar.

se puede realizar. Manejo del programa Los datos necesarios en el programa son: Etiqueta: Nombre de la variable. por defecto. por defecto. .El valor que se quiere contrastar en la Hipótesis Nula.En el intervalo de confianza. Una vez introducidos todos los datos. Cualitativa (a) à Una proporción. sin el fichero de datos. El programa asigna.El tipo de aproximación deseada en la Hipótesis Alternativa. z-Proporción: Se presenta el intervalo de confianza del parámetro proporción poblacional y los resultados del contraste de hipótesis de una proporción mediante la prueba z-proporción. Opciones: .α). que es el más habitual. el valor de α= 5%. la opción Análisis / Cualitativa (a) / Una proporción. pero también son habituales los valores α= 1% y α= 10%. Proporción Muestral: Proporción de la variable en la muestra p. El programa asigna. pero puede modificarse. el valor 0. El programa asigna. Ver menú Gráficos. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). Los fundamentos teóricos y la formulación son idénticos a los presentados en las opciones anteriores respectivas con datos a partir de fichero. por defecto. Alfa debe ser >0 y <100. .5. la opción ‘no igual’. Datos Agrupados A partir de los datos resumidos de tamaño muestral y propoción muestral. Tamaño Muestral: Valor de n.74 Barras: Gráfico de barras para una variable cualitativa. se accede a la pestaña z-Proporción. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . .

Manual G-Stat 2.6000 Estimación ---------I. El programa asigna. El programa asigna. Proporción Muestral= 0. Alfa debe ser >0 y <100.2682 . por defecto.α).C.El tipo de aproximación deseada en la Hipótesis Alternativa. .5000 no igual 0. pero puede modificarse.5.7514] Contraste z-Proporción ---------------------Hipótesis Nula : Hipótesis Alternativa : p-valor (exacto): proporción = 0.El valor que se quiere contrastar en la Hipótesis Nula.0 75 z-Proporción: Se presenta el intervalo de confianza del parámetro proporción poblacional y los resultados del contraste de hipótesis de una proporción mediante la prueba z-propoción. el valor de α= 5%. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). Tamaño Muestral= 40. al 95. Los datos necesarios son: Etiqueta=Fumador. el valor 0. por defecto. 0. Estimación y Contraste de Una Proporción Poblacional para Fumador ====================================================================== Tamaño Muestral : 40 Proporción: 0. : Se realiza un contraste de hipótesis sobre la variable Fumador. pero también son habituales los valores α= 1% y α= 10%. El programa asigna.En el intervalo de confianza. . el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . que es el más habitual. por defecto. Resultados de la pestaña z-Proporción de la opción Una Proporción.4333.00% para la proporción: [0.6. la opción ‘no igual’. Opciones: .

Este estadístico de contraste sigue una distribución Chi-Cuadrado con grados de libertad igual al número de tramos considerados menos uno y menos el número de parámetros estimados. es necesario realizar los siguientes cálculos adicionales: Z = nD Q = Exp (-1.76 Cuantitativa (y) Abre un submenú con diferentes técnicas estadísticas para una variable cuantitativa. Se analiza mediante pruebas de bondad de ajuste si se puede asumir que una variable sigue o no la distribución Normal o Uniforme. Prueba de bondad de ajuste Kolmogorov Se calcula el estadístico D como la máxima distancia observada entre la función de distribución teórica y la empírica. Este contraste sólo se realiza si n mayor o igual que 20. Prueba de bondad de ajuste Chi-Cuadrado Se divide en tramos el rango de la variable y se analiza el número de valores observados en los distintos tramos y los valores esperados según la distribución teórica correspondiente. la prueba de bondad de ajuste de Kolmogorov con corrección de Lilliefors y la prueba de bondad de ajuste de Shapiro-Wilk. Cuantitativa (y) à Ajuste Esta opción realiza una prueba de ajuste a una distribución teórica. asociado a este estadístico D. Chi-Cuadrado para una desviación típica. Para calcular el p-valor. Las pruebas que se contemplan para el ajuste a una Normal son la prueba de bondad de ajuste Chi-Cuadrado. Las pruebas que se contemplan para el ajuste a una Uniforme son la prueba de bondad de ajuste Chi-Cuadrado y la prueba de bondad de ajuste de Kolmogorov. El estadístico de contraste se evalúa como la suma en los distintos tramos considerados del cociente entre las diferencias al cuadrado de las frecuencias observadas y esperadas entre las frecuencias esperadas.233701 / Z 2 ) . t-Student y Chi-Cuadrado para una desviación típica para datos agrupados. Se incluyen las siguientes pruebas: bondad de ajuste. rangos signados y signos. t-Student.

4* A*C 2*A si D = DC ⇒ pL = 0.2.506628/ Z) * (Q + Q9 + Q25 ) si 1 <= Z < 3.valor = 0 Prueba de bondad de ajuste de Kolmogorov con corrección de Lilliefors En el caso de realizar la prueba de Kolmogorov de ajuste a la normal.78019 ) B = 2.7.90289126 054 * n0.1" .valor = 1 .7.(2.974598 / n + 1.0 Q2 = Exp (-2 * Z 2 ) si 0 <= Z < 0.27 ⇒ p .49 C = 2.1 si D > DC ⇒ p L = Exp ( A * D 2 + B * D + C .1 ⇒ p .27 <= Z < 1 ⇒ p .Q216 ) si Z >= 3.valor = 2 * (Q2 .3025851 ) si D < DC ⇒ p L =" > 0.1804661 + 0.Q2 4 + Q2 9 .01256 * (n + 2.78019 C = 2.67997 / n Si n > 100 ⇒ A = . es recomendable utilizar la corrección de Lilliefors.99587 * n + 2.18037017 5721 * n0.1 ⇒ p .98 B = 3.valor = 1 77 si 0.Manual G-Stat 2.2947256 Y se calcula DC de forma que DC = − B − B*B. con lo que el p-valor de Lilliefors p L se calcula de la forma siguiente: Si n <= 100 ⇒ A = .

Se detallan en Cuantitativa (y). Histograma: Genera un histograma.9772 .Distribución: Normal o uniforme. Opciones: . que la técnica más moderna de G-Stat es el algoritmo AS R94 para el cálculo de la prueba W de Shapiro-Wilk. Estadísticos: Estadísticos de la variable seleccionada. Se puede decir. Contrastes de Hipótesis de Bondad de Ajuste para FC2FC1 ========================================================================== Número de Casos: 40 Distribución Teórica: Media: Desviación Típica: Normal 61. Contraste: Resultados de la prueba de bondad de ajuste de una variable a una distribución teórica. Resultados del contraste de normalidad de la variable FC2FC1. : Se desea comprobar si la variable FC2FC1 sigue una distribución Normal. Más información en el apartado Menú Gráficos. por tanto.7500 10. Hasta el año 2000 los principales programas estadísticos comerciales no corrigieron el error y siguieron usando el algoritmo AS 181.78 Prueba de bondad de ajuste de Shapiro-Wilk Shapiro y Wilk (1965) introducen la prueba W de normalidad. Manejo del programa Variables: Se identifica la variable cuantitativa para ver su posible distribución. Royston implementa un algoritmo con el nombre de AS 181 para 7≤n≤2000 para llevar a cabo dicha prueba. En G-Stat está implementada la versión corregida AS R94. En 1992 el propio Royston descubre que el algoritmo AS 181 es incorrecto para n>50 y en 1995 propone un nuevo algoritmo con el nombre de AS R94 válido para 3≤n≤5000. Posteriormente. en 1982.

Manual G-Stat 2.de Kolmogorov: DN: p-valor: 0.4782 72.0218 6 6.6667 0.9753 0.9776 D+ de Kolmogorov: D.0667 66.0738 0.1 0.0633 -0.0218 61.L.6667 0.0738 0. Esperadas Chi-Cuadrado -------------------------------------------------------------------------inferior 51.5212 p-valor Lilliefors corregido: W Shapiro-Wilk: p-valor Shapiro-Wilk: La prueba recomendada es la de Shapiro-Wilk.0667 57.0167 -------------------------------------------------------------------------Chi Cuadrado = 0.3696 superior 7 6.6667 0. Cuantitativa (y) à t-Student Realiza el intervalo de confianza del parámetro poblacional media y un contraste de hipótesis mediante la prueba t-Student para una muestra.6667 0.6667 0. El intervalo de confianza para una media se calcula como µ ∈ x ± t1− α / 2.4782 6 6.0 79 -------------------------------------------------------------------------Límite Límite Inferior Superior Frec.2000 con 3. p-valor = 0.0 G.0167 72.0167 51.7500 7 6.9812 >0.0167 61.glEE(x) donde ∑ xi n n [ ] x = i =1 s= 2 1 n  ∑ xi − x  n − 1  i=1  ( ) .6667 0.3696 7 6. Observadas Frec.1304 57.7500 66.1304 7 6.

() representa el valor de la abscisa en una curva de una distribución t-Student con gl grados de libertad dados por (n .80 EE x = () s n gl siendo EE x el error estándar de la media y t1-α/2.26. se tiene que plantear el problema en términos de contraste de hipótesis. En el caso de que se esté interesado en dar afirmaciones acerca de µ en términos de. Para contrastes bilaterales se calcula el p-valor como el área bajo la curva tStudent con (n . Manejo del programa Variables: Se identifica la variable cuantitativa a analizar. por ejemplo. Para contrastes unilaterales del tipo: H0: µ = µ0 H1: µ > µ0 se calcula t como antes.α/2 y a la derecha un área de α/2. .1) grados de libertad a la derecha del valor absoluto de t más el área a la izquierda de menos el valor absoluto de t.gl = 2. se construye el estadístico de contraste experimental t dado por t= x − µ0 s n que recibe el nombre de prueba t-Student para una media y que bajo la hipótesis nula sigue una distribución t-Student con (n . Este valor se encuentra tabulado. que deja a la izquierda de su valor un área de 1 . donde: H0: µ = µ0 H1: µ ≠ µ0 siendo H0 la hipótesis nula y H1 la hipótesis alternativa.05 y gl = 9 se tiene que t1-α/2. pero a la hora de calcular el p-valor sólo se considera el área bajo la curva de la distribución normal a la derecha de t (sin considerar el valor absoluto).1). que la media en la población sea un determinado valor µ0. de forma que para α = 0. Para llevar a cabo este contraste.1) grados de libertad.

El valor que se quiere contrastar en la Hipótesis Nula. Estimación y Contraste de Una Media Poblacional para FC2FC1 ====================================================================== Tamaño Muestral: Media: 40 61. la opción ‘no igual’.0083 0. .2. el valor de α= 5%.0000 mayor que 1.0000% para la media: t-Student --------Hipótesis Nula: Hipótesis Alternativa: Estadístico de contraste t: p-valor: 61.8256] media = 60. Ver menú Gráficos t-Student: Se presenta el intervalo de confianza del parámetro poblacional media y los resultados del contraste de hipótesis de una media mediante la prueba t-Student para una muestra.7500 .7500 Estimación ---------I. : Contrastar si la media de la variable FC1FC2 es superior a 60.1598 . por defecto. Opciones: . Cajas: Gráfico de Cajas para una variable cuantitativa.9244 [58. pero puede modificarse. que es el más habitual. . el nivel de confianza se toma del valor alfa (nivel de confianza= 100 .El tipo de aproximación deseada en la Hipótesis Alternativa. inferior al 95.Manual G-Stat 2. Se detallan en Cuantitativa (y). Alfa debe ser >0 y <100.0. El programa asigna.0 81 Estadísticos: Estadísticos de la variable seleccionada. Resultados de la prueba t-Student para una variable. por defecto.α). pero también son habituales los valores α= 1% y α= 10%.En el intervalo de confianza.C. El programa asigna. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). El programa asigna. el valor 0. por defecto.

que la desviación típica en la población sea un determinado valor σ0. El intervalo de confianza de una desviación típica se calcula como  2  ∑ xi − x σ∈ . Para llevar a cabo este contraste se construye el estadístico de contraste experimental χ2 dado por χ2 = ( n − 1) s2 σ2 0 = ∑ xi − x σ2 0 ( ) 2 que bajo la hipótesis nula sigue una distribución Chi-Cuadrado con grados de libertad gl = n .α/2 y χ 2 .α / 2 = 2.1.82 Cuantitativa (y) à Chi-2 para una Desviación Típica Realiza el intervalo de confianza del parámetro poblacional desviación típica y un contraste de hipótesis de una desviación típica mediante el estadístico de Chi-Cuadrado.α / 2 representa el valor de la abscisa en gl una curva de una distribución Chi-Cuadrado con grados de libertad gl que deja a la izquierda de su valor un área de α/2. se tiene que plantear el problema en términos de contraste de hipótesis. 2  χgl.05 y n=10.1− α / 2  ( ) ∑ xi − x χ2 .1−α / 2 = 19. por ejemplo. de forma que para α = 0. . gl gl En el caso de que se esté interesado en dar afirmaciones acerca de σ en términos de. 0228 y χ 2 . Manejo del programa Variables: Se identifica la variable cuantitativa a analizar.1 −α / 2 representa el valor de la abscisa en una curva de una gl distribución Chi-Cuadrado con grados de libertad gl=n-1 que deja a la izquierda de su valor un área de 1 .α / 2 gl ( ) 2      donde χ 2 .7004 . se tiene que χ2 . donde: H0: σ = σ0 H1: σ ≠ σ0 siendo H0 la hipótesis nula y H1 la hipótesis alternativa.

que es el más habitual. El programa asigna.0. : Se quiere contrastar si la desviación típica de la variable FC2FC1 es superior a un valor teórico de 8. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 .El tipo de aproximación deseada en la Hipótesis Alternativa. por defecto.7500 10. El programa asigna. Ver menú Gráficos Chi-Cuadrado: Se presenta el intervalo de confianza del parámetro poblacional desviación típica y los resultados del contraste de hipótesis de una desviación típica mediante el estadístico de Chi-Cuadrado. inferior al 95. El programa asigna.00% para la desviación típica: [9.El valor que se quiere contrastar en la Hipótesis Nula.α). el valor 1. . que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). el valor de α= 5%.C.2798] Contraste Chi-Cuadrado ---------------------- . Estimación y Contraste de Una Desviación Típica Poblacional para FC2FC1 ====================================================================== Tamaño Muestral: Media: Desviación Típica: Grados de Libertad: 40 61. pero también son habituales los valores α= 1% y α= 10%.9772 39 Estimación ---------I. Cajas: Gráfico de Cajas para una variable cuantitativa. . por defecto. Resultados de la prueba Chi-2 para una desviación típica.Manual G-Stat 2. la opción ‘no igual’. por defecto. Alfa debe ser >0 y <100. pero puede modificarse.0 83 Estadísticos: Estadísticos de la variable seleccionada. Opciones: .En el intervalo de confianza. Se detallan en Cuantitativa (y).

media y desviación típica muestral. por defecto. sin el fichero de datos. pero puede modificarse.4297 0. Se accede a las pestañas t-Student y Chi-Cuadrado.84 Hipótesis Nula: Hipótesis Alternativa: Estadístico de contraste chi-cuadrado: p-valor: sigma = 8.0000 mayor que 73. Datos Agrupados A partir de los datos resumidos de tamaño muestral. la opción ‘no igual’. . el valor 0. Tamaño muestral: el valor de n. El programa asigna. se i verifica que ∑ xi − x ( ) 2 = ( n − 1) s2 Manejo del programa Los datos necesarios son: Etiqueta: Nombre variable.El valor que se quiere contrastar en la Hipótesis Nula. t-Student: Se presenta el intervalo de confianza del parámetro poblacional media y los resultados del contraste de hipótesis de una media mediante la prueba t-Student para una muestra. Media muestral Desviación típica muestral.El tipo de aproximación deseada en la Hipótesis Alternativa. Se tiene en cuenta que aunque no se tengan los valores individuales x. El programa asigna.0.0007 Cuantitativa (y) à t-Student y Chi-2 para dt. las opciones Análisis / Cuantitativa (y) / t-Student y Análisis/ Cuantitativa (y) / Chi-2 para una Desviación Típica. que es el más habitual. Los fundamentos teóricos y la formulación son idénticos a los presentados en las opciones anteriores respectivas con datos a partir de fichero. que puede . por defecto. se puede realizar. Es necesario haber cumplimentado todos los datos. Opciones: .

asignando el rango medio en caso de empates poniendo el signo que tuviera la variable Rta2 (de ahí el nombre de Rangos signados). el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . por defecto. El programa asigna.Manual G-Stat 2. Cuantitativa (y) à Rangos Signados Realiza un contraste de hipótesis de la mediana de una distribución mediante la prueba de los Rangos signados. Alfa debe ser >0 y <100. el valor de α= 5%. el valor de α= 5%. El programa asigna. Alfa debe ser >0 y <100. Opciones: . 85 que’ (referido al valor .= número de signos (-) de Rta2 n * = n+ + n- . La prueba de los Rangos signados para una muestra calcula la variable Rta2 como en el caso de la prueba de Signos. el valor 1. por defecto. Es una prueba no paramétrica. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . después se calcula los rangos de Orden del valor absoluto de Rta2.El valor que se quiere contrastar en la Hipótesis Nula. que es el orden que ocupa la variable Valor absoluto de Rta2. . Chi-Cuadrado: Se presenta el intervalo de confianza del parámetro poblacional desviación típica y los resultados del contraste de hipótesis de una desviación típica mediante el estadístico de Chi-Cuadrado.α). . pero también son habituales los valores α= 1% y α= 10%. por defecto. El programa asigna.El tipo de aproximación deseada en la Hipótesis Alternativa. que es el más habitual. la opción ‘no igual’. pero también son habituales los valores α= 1% y α= 10%. por defecto.En el intervalo de confianza.α). pero puede modificarse. Como antes: n + = número de signos (+) de Rta2 n .0 modificarse por ‘mayor que’ o ‘menor que contrasta la hipótesis nula).0.En el intervalo de confianza. a continuación se crea la variable Orden del valor absoluto de Rta2. El programa asigna. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula).

Ver menú Gráficos . Se detallan en Cuantitativa (y).86 A partir de estos rangos se consideran T+ = T− = que verifican E[T + ] = E[T − ] = V[T+ ] = V[T− ] = 1 4 n* n* + 1 . ∑ rangos. grupo + ∑ rangos. grupo − ( ) 1 * * 1 3 n n + 1 2n* + 1 − ∑ nº empates − nº empates 24 empates 48 ( )( ) ( ) La forma de realizar los contrastes bilaterales y unilaterales se recoge en la siguiente tabla: Hipótesis nula med = med0 med = med0 med = med0 Hipótesis alternativa med ≠ med0 med < med0 med > med0 T mín {T+ T-} T+ T- En todas las situaciones el estadístico de contraste es z= T − E[T ] V [T ] que sigue una distribución normal N(0. Estadísticos: Estadísticos de la variable seleccionada.1). Manejo del programa Variables: Se identifica la variable cuantitativa a analizar. Cajas: Gráfico de Cajas para una variable cuantitativa.

. por defecto. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula).1287 (con corrección por empates) 0. Opciones: . : Contrastar. El programa asigna. si la mediana de la variable FC2 es superior a 130. pero puede modificarse. mediante la prueba de Rangos signados.El tipo de aproximación deseada en la Hipótesis Alternativa. el valor 0.0000 no igual Rango medio de valores por debajo del valor a contrastar de la mediana: 22.Manual G-Stat 2.0 87 Rangos Signados: Se presentan los resultados del contraste de hipótesis de la mediana de una distribución mediante la prueba de Rangos signados. la opción ‘no igual’. por defecto.7917 Estadístico de contraste: p-valor: -3.0000 Rangos Signados --------------Hipótesis Nula: Hipótesis Alternativa: mediana = 130. El programa asigna. Resultado de la prueba de los rangos signados para una variable. Es una prueba no paramétrica.El valor que se quiere contrastar en la Hipótesis Nula.0. . Prueba de Rangos Signados de la mediana para FC2 ====================================================================== Tamaño Muestral: 40 Mediana: 137.9464 Rango medio de valores por encima del valor a contrastar de la mediana: 14.0018 Cuantitativa (y) à Signos Realiza un contraste de hipótesis de la mediana de una distribución mediante la prueba de los signos. que es el más habitual.

Manejo del programa Variables: Se identifica la variable cuantitativa a analizar.} n+ n- En todas las situaciones se considera E[k ] = V[k ] = 1 * n 2 11 * n 22 y el estadístico de contraste es z= k − E[k ] V [k ] que sigue una distribución normal N(0. en primer lugar.1). ya que no se cuentan los empates producidos por aquellos valores de individuos con valor en la variable original igual a med 0. que se denota por Rta. a la que se denota por Rta2. menos el valor que se está contrastando med0.88 La prueba de los Signos para una muestra calcula.= número de signos (-) de Rta2 n * = n+ + ncon lo que n+ sería el número de valores de Rta por encima del valor de la mediana que se esté contrastando y n. Observar que n* es menor que el tamaño original. La forma de realizar los contrastes bilaterales y unilaterales se recoge en la siguiente tabla: Hipótesis nula med = med0 med = med0 med = med0 Hipótesis alternativa med ≠ med0 med < med0 med > med0 k mín {n+ .sería el número de valores de Rta por debajo. . Para esta nueva variable se calculan: n + = número de signos (+) de Rta2 n . una nueva variable. que es igual a la variable original. n .

Opciones: . Cajas: Gráfico de Cajas para una variable cuantitativa. mediante la prueba de los signos.0057 . : Contrastar.0000 mayor que 12 28 Número de valores por debajo del valor a contrastar de la mediana: Número de valores por encima del valor a contrastar de la mediana: Estadístico de contraste: p-valor: -2.El valor que se quiere contrastar en la Hipótesis Nula. la opción ‘no igual’. si la mediana de la variable FC2 es superior a 130.0.0 89 Estadísticos: Estadísticos de la variable seleccionada. Se detallan en Cuantitativa (y). Resultados de la prueba de los signos para una variable. por defecto. Prueba de Signos de la mediana para FC2 ======================================================================== Tamaño Muestral: Mediana: Signos -----Hipótesis Nula: Hipótesis Alternativa: 40 137. el valor 0. que es el más habitual.Manual G-Stat 2.5298 0. pero puede modificarse. Ver menú Gráficos Signos: Se presentan los resultados del contraste de hipótesis de la mediana de una distribución mediante la prueba de signos. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). El programa asigna. El programa asigna. por defecto.El tipo de aproximación deseada en la Hipótesis Alternativa. .0000 mediana = 130.

Chi-Cuadrado de tendencia lineal. En el caso de que una de las variables haga el papel de variable respuesta y sea dicotómica. Chi-Cuadrado de tendencia lineal para datos agrupados. se construye en primer lugar la tabla de contingencia de dimensiones r (número de filas) por c (número de columnas) con las frecuencias absolutas observadas n ij. A continuación se calcula la tabla de contingencia de frecuencias absolutas esperadas mediante la expresión: eij = ri c j n donde ri indica el total de individuos de la fila i . . cj el total de individuos de la columna j y n el total de individuos. Tablas (a|b) à Chi-Cuadrado Realiza la prueba Chi-Cuadrado que contrasta la asociación entre dos variables cualitativas que pueden ser dicotómicas o nominales. Fisher para datos agrupados. z-proporciones para datos agrupados. McNemar y McNemar para datos agrupados. El estadístico de contraste es χ2 = ∑ ∑ r c (nij − eij )2 eij i =1 j =1 que sigue bajo la hipótesis nula una distribución χ2. Chi-Cuadrado para datos agrupados. Se incluyen las siguientes pruebas: Chi-Cuadrado. en otros casos no se supone ningún modelo y estamos ante técnicas de asociación. estamos hablando de la comparación de varias proporciones. Se necesita que no más del 20% de las celdas tengan valores esperados menores de cinco. Fisher. que son el resultado de contar el número de individuos para cada par de posibilidades de los distintos niveles i de la variable en filas y j de la variable en columnas. Para calcular el estadístico de contraste Chi-Cuadrado. En algunos casos se supone que existe un modelo donde una variable explicativa cualitativa (a) explica una variable respuesta cualitativa (b). con (r-1)x(c-1) grados de libertad.90 Tablas (a|b) Contiene un submenú con diferentes técnicas estadísticas para dos variables cualitativas.

00 | 50. : Realizar la prueba Chi-Cuadrado para establecer si la variable Sexo está relacionada con la variable Fumador. Tabla de Frecuencias de FUMADOR (filas) por SEXO (columnas) ====================================================================== Número de Casos: 40 SEXO | 1 | 2 | Total FUMADOR | | | Fila -----------------------------------------------------| 10 | 6 | 16 1 | 62.00 -----------------------------------------------------| 12 | 12 | 24 2 | 50.00 | 60. Chi-Cuadrado: Se presentan los resultados de la prueba Chi-Cuadrado que contrasta la asociación entre dos variables cualitativas. Tabla de frecuencias de la opción Chi-Cuadrado.Manual G-Stat 2. para ver la validez de los resultados.00 | 100.0 Manejo del programa Variables: Se identifica la Variable Fila y la Variable Columna.00 -----------------------------------------------------Total | 22 | 18 | 40 Columna | 55. Asimismo.50 | 40.00 Los porcentajes de cada celda se refieren al total de cada fila . se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). por defecto. el número y proporción de celdas con frecuencias absolutas esperadas menor de 5 y menor de 1. los porcentajes referidos al total de la tabla.50 | 37.00 | 45. 91 Tablas: Se muestra la tabla de contingencia de dos variables cualitativas. El programa calcula. se muestra. Adicionalmente.

Datos Agrupados A partir de datos agrupados se realiza la prueba de Chi-Cuadrado para dos variables cualitativas. un 0. Adicionalmente. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. un 0. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero. Los datos agrupados se introducen directamente en una cuadrícula en forma de tabla de r filas y c columnas. negativos. se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). Se puede definir el número de niveles de las dos variables mediante el número de filas y columnas. Chi-Cuadrado de FUMADOR (filas) por SEXO (columnas) ====================================================================== Tamaño Muestral: 40 Estadístico de contraste Chi-Cuadrado: 0.: 1 p-valor: 0.0000% Tablas (a|b) à Chi-Cuadrado.92 Resultados de la prueba Chi-Cuadrado. Estos valores son los que se han introducido en la cuadrícula de entrada de datos. Tablas: Se muestra la tabla de contingencia de dos variables cualitativas. Por defecto aparecen en la tabla unos valores que deben ser sustituidos por los datos del usuario. El botón "Crear Tabla" prepara la estructura de la tabla ajustada al número de filas y columnas definido.4363 Nº de celdas con frecuencias absolutas esperadas < 5: 0 de 4.L. Este programa no permite tablas menores de 2x2.0000% Nº de celdas con frecuencias absolutas esperadas < 1: 0 de 4. Las celdas de la tabla no admiten valores faltantes.6061 G. No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. Manejo del programa Datos Agrupados: En la pestaña de datos agrupados hay una cuadrícula que permite la entrada directa del número de casos dentro de cada posible combinación de categorías o niveles. en una categoría en columna (porcentajes . decimales o alfanuméricos.

0000% Tablas (a|b) à Dos Proporciones. Datos Agrupados A partir de datos agrupados se realiza el intervalo de confianza del parámetro diferencia poblacional de dos proporciones y el contraste de hipótesis de dos proporciones mediante la prueba z-Proporciones. Asimismo. El programa calcula. : Se desea realizar la prueba Chi-Cuadrado sobre la siguiente tabla de contingencia: Var a_1 Var b_1 Var b_2 23 34 Var a_2 45 66 Var a_3 12 26 En la pestaña Datos Agrupados crear una tabla de 2 filas y 3 columnas. por . Tratamiento con dos niveles dados por Tratamiento A y Tratamiento B y otra variable respuesta.5965 esperadas < 5: 0 de 6. introducir los datos. por defecto. Si se está en el caso de que se tengan dos variables dicotómicas donde se pueda considerar una variable explicativa. un 0.0000% esperadas < 1: 0 de 6. los porcentajes referidos al total de la tabla. Chi-Cuadrado de Filas por Columnas ======================================================================== Tamaño Muestral: Estadístico de contraste Chi-Cuadrado: G. el número y proporción de celdas con frecuencias absolutas esperadas menor de 5 y menor de 1.: p-valor: Nº de celdas con frecuencias absolutas Nº de celdas con frecuencias absolutas 206 1. hacer clic en cualquier otra celda de la tabla agregada para confirmar todos los datos e ir a la pestaña Chi-Cuadrado.0334 2 0.Manual G-Stat 2. un 0.0 93 columna) y del total de individuos (porcentaje total). Resultados de la prueba Chi-Cuadrado. se muestra.L. por ejemplo. para ver la validez de los resultados. Chi-Cuadrado: Se presentan los resultados de la prueba Chi-Cuadrado que contrasta la asociación entre dos variables cualitativas.

p 2 ≠ p 0 siendo H0 la hipótesis nula y H1 la hipótesis alternativa. es necesario construir el estadístico de contraste experimental z dado por z= ˆ (p 1 ˆ − p 2 − (p 1 − p 2 ) ˆ ˆ EE p 1 − p 2 ( ) ) Bajo la hipótesis nula p 0 = 0. Estado de salud con dos niveles dados por Enfermo y Sano. La forma de realizar un intervalo de confianza para el verdadero valor del parámetro diferencia de dos proporciones p 1 – p 2 es ˆ p ∈ ˆ1 − ˆ2 ± z1 − α / 2EE(ˆ1 − p 2 ) p p p [( ) ] donde ^p1 representa la proporción muestral estimada para p 1 y ^p2 representa la proporción muestral estimada para p2 y EE(^p 1 -^p2 ) el error estándar estimado de la diferencia de dos proporciones (la raíz cuadrada de la varianza de la distribución muestral de la diferencia de dos proporciones) dado por ˆ ˆ ˆ EE(p1 − p2 ) = EE p1 ( ) 2 ˆ + EE p2 ( ) 2 = ˆ1 1 − ˆ1 p p n1 ( ) + ˆ (1 − ˆ ) p p 2 2 n2 que recoge la variabilidad muestral.94 ejemplo. Para ello se estudiaría la diferencia entre la proporción de enfermos para el Tratamiento A y la proporción de enfermos para el Tratamiento B. las dos proporciones son iguales y se tiene que ˆ ˆ EE(p1 − p2 ) = ˆ ˆ p1 1 − p1 n1 ( ˆ ˆ ) + p (1 − p ) = p(1 − p) + p(1 − p) = p(1 − p)[(1 n ) + (1 n )] ˆ ˆ ˆ ˆ ˆ ˆ n n n 2 2 2 1 2 1 2 donde ^p está dada por: ˆ= p ˆ ˆ p1n1 + p 2n2 n1 + n2 .p 2 = p0 H1: p 1 . En el caso de que se quiera realizar contraste de hipótesis para dos proporciones del tipo: H0: p 1 . se podría ver si hay influencia de la variable explicativa Tratamiento en la variable respuesta Estado de salud.

Proporción Grupo2: Valor de p2. menor que.Permite cambiar los valores que por defecto aparecen. . Hipótesis alternativa: (no igual. Hipótesis nula: 0. z-Proporciones: Resultados de la estimación y contraste de la diferencia de dos proporciones. En el caso de proporciones extremas conviene usar el método exacto basado en la distribución binomial.0.0%. En el caso de que p 0 ≠ 0. : Comparar una proporción del 48% con un tamaño de muestra de 52.0 95 y representa una proporción común de individuos que tienen presente la característica de interés sin distinguir por grupos. Opciones: . Tamaño Grupo2: Valor de n2. mayor que) y alfa: 5. Proporción Grupo1: Valor de p1. Nombre Grupo 2: Etiqueta Categoría2. Tamaño Grupo1: Valor de n1. frente a una del 28% con un tamaño de muestra de 47. Manejo del programa Datos Agrupados: Los datos necesarios en el programa son: Nombre Grupo 1: Etiqueta Categoría1. se tiene que ˆ ˆ EE(p1 − p2 ) = ˆ ˆ p1 1 − p1 n1 ( ˆ ˆ ) + p (1 − p ) 2 2 n2 proporciona el error estándar de la diferencia de dos proporciones.Manual G-Stat 2.

3869] Contraste z-Proporciones -----------------------Hipótesis Nula: proporción1-proporción2 = 0. Resultados de la opción comparación de dos proporciones.2000 0.0421 p-valor: 0.0693 y 0.2000 +/.4800 y 0. 0.1869 [0.00% para la diferencia de dos proporciones: 0.0655 0. al 95.0411 Tablas (a|b) à Chi-Cuadrado de Tendencia Lineal (y|b) Realiza la prueba Chi-Cuadrado de tendencia lineal de proporciones de una variable respuesta dicotómica (b) a partir de los subgrupos formados por una variable explicativa discreta cuantitativa (y). Estimación y Contraste de la Diferencia Poblacional de Dos Proporciones ====================================================================== Tamaños Muestrales: Proporciones: Error estándar de las proporciones: Diferencia de proporciones: Error estándar de la diferencia de proporciones: 52 y 47 0. La notación que se sigue es la de una matriz con 2 filas y k columnas donde: .C.96 Entrada de datos para la comparación de dos proporciones.0.0131. El estadístico de contraste Chi-Cuadrado de tendencia lineal es un componente del valor del estadístico Chi-Cuadrado para tablas de frecuencias.0953 Estimación ---------I.0000 Hipótesis Alternativa: no igual Estadístico de contraste z: 2.2800 0.

los porcentajes referidos al total de la tabla.Manual G-Stat 2. en filas=var. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). Manejo del programa Variables: Se identifica la Variable Fila y la Variable Columna. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. El programa calcula. explicativa X Var. Chi-Cuadrado de Tendencia Lineal: Contrasta la linealidad (creciente o decreciente) de la respuesta en función de la variable formadora de grupos. con lo que éste variará si se cambia la codificación de la variable respuesta. Adicionalmente.0 Var. Tablas: Se muestra la tabla de contingencia de dos variables cualitativas. Se observa que las “etiquetas” de la variable explicativa intervienen en el cálculo del estadístico de contraste. en columnas=var. por defecto. respuesta 1=”Presencia” 0=”Ausencia” Total x1 y1 (n 1-y1) n1 x2 y2 (n 1-y1) n2 … … … … xk yk (n k-yk) nc 97 Total y n-y n El estadístico de contraste Chi-Cuadrado de tendencia lineal viene dado por k  k  n n ∑ yix i − y ∑ ni xi   i= 1 i =1  2 χt = 2  k k y(n − y )n ∑ nix 2 −  ∑ nix i     i  i= 1    i= 1   2 que sigue una Chi-Cuadrado con un grado de libertad. .

64 | 8.67 | 55.0109 Tablas (a|b) à Chi-Cuadrado de Tendencia Lineal. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero.L.00 Los porcentajes de cada celda se refieren al total de cada columna Resultados de la prueba Chi-Cuadrado de tendencia lineal.: 1 p-valor: 0.4878 G. . Chi-Cuadrado de tendencias de SEXO (filas) por STATUS (columnas) =========================================================================== Tamaño Muestral: 40 Estadístico de contraste Chi-Cuadrado de tendencias: 6.00 | 100.00 ------------------------------------------------------------------Total | 17 | 11 | 12 | 40 Columna | 42.50 | 27.36 | 91.00 ------------------------------------------------------------------| 7 | 4 | 11 | 22 1 | 41. Datos Agrupados (y|b) A partir de datos agrupados se realiza la prueba Chi-Cuadrado de tendencia lineal de proporciones.33 | 45.18 | 36.50 | 30. Los datos agrupados se introducen directamente en una cuadrícula en forma de tabla de (2+1) filas y c columnas.98 : Realizar la prueba Chi-Cuadrado de tendencia lineal para establecer si la variable Sexo está relacionada linealmente con la variable Status. Tabla de frecuencias Tabla de Frecuencias de SEXO (filas) por STATUS (columnas) =========================================================================== Número de Casos: 40 STATUS | 1 | 2 | 3 | Total SEXO | | | | Fila ------------------------------------------------------------------| 10 | 7 | 1 | 18 2 | 58.82 | 63.

Se puede asociar un valor numérico a las categorías o niveles de la variable explicativa ordinal que va en columnas y que se introducen en la primera fila de la tabla. Este programa no permite tablas menores de 2x2. Tablas: Se muestra la tabla de contingencia de dos variables cualitativas. ya que la variable respuesta siempre es dicotómica con valores de "presencia" y "ausencia". En las dos filas siguientes de la tabla se especifican el número de casos para cada nivel de la variable explicativa según la presencia o ausencia de la variable respuesta. Por defecto aparecen en la tabla unos valores que deben ser sustituidos por los datos del usuario. decimales o alfanuméricos. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías.0 Manejo del programa 99 Datos Agrupados: La disposición de la tabla para la entrada de datos es la siguiente: En la pestaña de datos agrupados hay una cuadrícula que permite la entrada directa del número de casos dentro de cada posible combinación de categorías o niveles. se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. El botón "Crear Tabla" prepara la estructura de la tabla ajustada al número de columnas definido.Manual G-Stat 2. Las celdas de la tabla no admiten valores faltantes. negativos. Adicionalmente. Sólo se puede definir el número de categorías de la variable explicativa en columnas. en una categoría en columna (porcentajes columna) .

r1}. con la notación siguiente: Var1 Var2 Niv1 Niv2 Total Cat1 a c c1 Cat2 b d c2 Total r1 r2 n A continuación. d’. Se emplea para muestras pequeñas donde no se da el supuesto de que no haya más del 20% de las celdas con valores esperados menores de cinco. El p-valor unilateral izquierdo resultante es a'≤ a ∑ p a' . estamos hablando de la comparación de dos proporciones.100 y del total de individuos (porcentaje total). La prueba de Fisher utiliza cálculos exactos pues no se calcula la significación mediante la aproximación asintótica. Tablas (a|b) à Fisher Realiza la prueba de Fisher que contrasta la asociación entre dos variables dicotómicas. A partir de dichas tablas se calcula: p a' = r1! r2! c 1! c2 ! n! a'! b'! c' ! d' ! donde x! indica el factorial de x. que se calcula como x!=x·(x-1)·(x-2)·…·2·1. c’. por defecto. b’ = r1 –a’. Para calcular el estadístico de contraste. b’. 5!=5·4·3·2·1=120. los porcentajes referidos al total de la tabla. El programa calcula. se construyen todas las tablas de contingencia 2x2 posibles con celdas a’. En el caso de que una de las variables haga el papel de variable respuesta. Chi-Cuadrado de Tendencia Lineal: Contrasta la linealidad (creciente o decreciente) de la respuesta en función de la variable formadora de grupos. siendo 0 ≤ a’ ≤ mín{c1 . se construye la tabla de contingencia de dimensiones 2x2 con las frecuencias absolutas observadas. por ejemplo. c’ = c1 – a’ y d’ = r2 – c’.

ordenar los datos para conseguir la disposición deseada. Datos agrupados Contrasta la asociación entre dos variables dicotómicas mediante la prueba exacta de Fisher. Tablas: Muestra la tabla de contingencia de dos variables cualitativas. . Tablas (a|b) à Fisher. se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). Adicionalmente. Fisher: Se presentan los resultados de la prueba de Fisher. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). esta prueba se restringe a variables dicotómicas. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. En GStat.Manual G-Stat 2. Si no es así. Los datos se introducen agrupados en frecuencias en la cuadrícula correspondiente. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero. Presenta los valores de los contrastes unilaterales y el bilateral.0 el p-valor unilateral derecho es a'≥ a 101 ∑ p a' y el p-valor bilateral es ∑ p a' pa' ≤ pa Manejo del programa Variables: Se identifica la Variable Fila y la Variable Columna. Se emplea para muestras pequeñas donde no se da el supuesto de que no haya más del 20% de las celdas con valores esperados menores de cinco. Asegurarse en la pestaña de tablas que el orden de las categorías es el deseado.

se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). . Si no es así. por defecto. con lo que la tabla resultante es siempre dos por dos. El programa calcula. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). Tablas: Muestra la tabla de contingencia de dos variables cualitativas. No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. Fisher: Se presentan los resultados de la prueba de Fisher. Asegurarse en la pestaña de tablas que el orden de las categorías es el deseado. negativos. Presenta los valores de los contrastes unilaterales y el bilateral. ordenar los datos para conseguir la disposición deseada. Este programa no permite tablas menores de 2x2. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Por defecto aparecen en la tabla unos valores que deben ser sustituidos por los datos del usuario.102 Manejo del programa Datos Agrupados: La disposición de la tabla para la entrada de datos es la siguiente: En la pestaña de datos agrupados hay una cuadrícula que permite la entrada directa del número de casos dentro de cada posible combinación de categorías o niveles. Las variables deben ser dicotómicas. decimales o alfanuméricos. Adicionalmente. los porcentajes referidos al total de la tabla. Las celdas de la tabla no admiten valores faltantes.

donde en cada celda están los pares correspondientes a cada cruce de categoría de las dos variables dicotómicas. Los pares discordantes (fuera de la diagonal principal) son los que influyen en la prueba. Adicionalmente. también se realiza el cálculo del coeficiente kappa de concordancia y de su significación estadística. se puede considerar el estadístico de contraste: χ 2 = (b − c )2 b+c que sigue una distribución Chi-Cuadrado con un grado de libertad y que tiene asociado el mismo p-valor ya que se cumple que z 2 = χ2 con lo que ambos procedimientos son equivalentes. el programa muestra el estadístico kappa de concordancia.Manual G-Stat 2. Adicionalmente. la notación es la siguiente: Var2 Var1 Cat1 Cat2 Total Cat1 a c c1 Cat2 b d c2 Total r1 r2 n El estadístico de contraste se construye como b− 1 (b + c ) 1 (b − c ) b − c 2 = 2 = 1 1 b+c b+c b+c 2 2 z= que sigue una distribución normal N(0.1). Es una prueba no paramétrica. Los datos se expresan en una tabla de contingencia 2x2. Este programa proporciona un pvalor asintótico para esta opción. que viene dado por . Alternativamente.0 103 Tablas (a|b) à McNemar Realiza la prueba de McNemar para datos pareados que compara dos proporciones de dos muestras pareadas.

La suma de los elementos de la diagonal secundaria no puede ser cero. ambas dicotómicas. Este programa proporciona un pvalor asintótico para esta opción. Manejo del programa Variables: Se identifica la 1º Variable Pareada y la 2ª Variable Pareada.104 κ= p 0 − pc 1 − pc con p0 = a+d rc −r c . para el análisis de los datos. se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). Tablas: Se muestra la tabla de contingencia de las variables pareadas. McNemar: Se presentan los resultados de la prueba de McNemar y Kappa. por defecto. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Adicionalmente. que la diagonal de concordancia viene dada por la casilla superior izquierda y la casilla inferior derecha. El programa calcula. Se asume. los porcentajes referidos al total de la tabla. ordenar los datos para conseguir dicha disposición. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). .1). pc = 1 1 2 2 2 n n El estadístico de contraste se construye como z= κ pc n(1 − p c ) que sigue una distribución normal N(0. Si no es así.

Las variables deben ser dicotómicas. decimales o alfanuméricos. reordenar los datos para conseguir dicha disposición. La suma de los elementos de la diagonal secundaria no puede ser cero. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero. Si no es así. Se asume que la diagonal de concordancia viene dada por la casilla superior izquierda y la casilla inferior derecha. Manejo del programa Datos Agrupados: La disposición de la tabla para la entrada de datos es la siguiente: En la pestaña de datos agrupados hay una cuadrícula que permite la entrada directa del número de casos dentro de cada posible combinación de categorías o niveles. Las celdas de la tabla no admiten valores faltantes. . también se realiza el cálculo del coeficiente kappa de concordancia y de su significación estadística.Manual G-Stat 2. Por defecto aparecen en la tabla unos valores que deben ser sustituidos por los datos del usuario.0 105 Tablas (a|b) à McNemar. negativos. con lo que la tabla resultante es siempre dos por dos. No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. Datos Agrupados A partir de datos agrupados se realiza la prueba McNemar. Los datos agrupados se introducen directamente en una cuadrícula en forma de tabla de 2 filas y 2 columnas. Adicionalmente.

106 Tablas: Se muestra la tabla de contingencia de las variables pareadas. factor de riesgo valores inferiores a uno. Adicionalmente. por defecto. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Epidemiología (b|b) à Tablas Las principales medidas de efecto para variables dicotómicas en Epidemiología son el riesgo relativo RR y el odds ratio OR. Tablas (Datos Agrupados) y Mantel-Haenszel (Datos Agrupados). se pueden obtener los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). El programa calcula. mientras que el odds ratio lo es tanto en estudios de cohortes como en estudios de casos y controles. McNemar: Se presentan los resultados de la prueba de McNemar y Kappa. los porcentajes referidos al total de la tabla. El riesgo relativo es válido generalmente en estudios de cohortes. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). factor protector La notación que se utiliza es la siguiente: Factor de exposición Enfermedad Sí No Total Sí a c c1 No b d c2 Total r1 r2 n . Epidemiología (b|b) Contiene un submenú con técnicas de Epidemiología. La interpretación para las dos medidas de efecto es similar: el valor uno indica ausencia de efecto valores superiores a uno. con las opciones de Tablas.

exp(LnOR + 1.5 en todas las celdas para evitar problemas de cálculo en las medidas de efecto.0 107 En el caso de celdas vacías. se suma 0. y se define como .Manual G-Stat 2. El riesgo relativo sólo tiene sentido calcularlo en estudios prospectivos. El odds ratio en estudios prospectivos se define por: Prob Enfermedad Expuestos OR = Prob Enfermedad ( 1 − Prob Enfermedad Expuestos ( ( 1 − Prob Enfermedad No Expuestos ( ) No Expuestos ) ) ) ) En estudios retrospectivos se define como: Prob Expuestos Enfermos OR = Prob Expuestos ( 1 − Prob Expuestos Enfermos ( ( 1 − Prob Expuestos No Enfermos ( ) No Enfermos) ) Se demuestra que ambas expresiones son equivalentes. La significación del OR viene dada por la prueba Chi-Cuadrado que en el caso de una tabla 2x2 tiene la siguiente expresión: χ2 = (a d − b c )2 n r1r2 c1 c 2 que sigue una distribución χ2 con (2 .1)x(2 .96 ⋅ EE(LnOR))) da el intervalo de confianza del OR directamente. por lo que la estimación del OR para estudios prospectivos y retrospectivos es la misma y viene dada por OR = a⋅d b⋅ c Para determinar el IC(OR) es conveniente trabajar con el transformado logarítmico del OR.96 ⋅ EE(LnOR)) . para lo cual es necesario calcular EE(LnOR) = con lo que: 1 1 1 1 + + + a b c d IC95%(OR) = (exp(LnOR − 1.1) = 1 grado de libertad.

por defecto. En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. se pueden dar los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila).108 RR = y que se estima por Pr ob Enfermedad Expuestos Pr ob Enfermedad No Expuestos ( ( ) ) RR = a ⋅ c2 b ⋅ c1 Para determinar el IC(RR) es conveniente trabajar con el transformado logarítmico del RR. Tablas: Se muestra la tabla de contingencia de dos variables cualitativas dicotómicas. exp (LnRR + 1. El programa calcula. para lo cual es necesario calcular EE(LnRR ) = 1 1 1 1 − + − a c1 b c2 con lo que IC95%(RR ) = (exp (LnRR − 1. los porcentajes por columnas corresponden a los porcentajes (riesgos) de los grupos expuestos y no expuestos. RR y OR: Se presentan las principales medidas de efecto para variables dicotómicas en Epidemiología: el Riesgo Relativo RR y el Odds . Si la variable explicativa (factor de exposición) se localiza en la variable columna. los porcentajes referidos al total de la tabla. La significación del RR es la misma que la significación del OR.96 ⋅ EE (LnRR ) ) ) da el intervalo de confianza del RR directamente. ambas dicotómicas. Manejo del programa Variables: Se identifica la Variable Respuesta (resolución) que aparecerá en filas y la Variable Explicativa (factor de exposición) que aparecerá en columnas. Adicionalmente. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). 96 ⋅ EE( LnRR )) .

con lo que la tabla es dos por dos. En el caso de celdas vacías. Los datos agrupados se introducen directamente en una cuadrícula en forma de tabla de 2 filas y 2 columnas. El nivel de confianza se puede modificar en la ventana de opciones considerándolo = (1-alfa). Se contrasta si los valores poblacionales de las medidas de efecto (RR y OR) son diferentes de 1. Por defecto aparecen en la tabla unos valores que deben ser sustituidos por los datos del usuario.0 109 Ratio OR.Manual G-Stat 2. . Chi-Cuadrado: Se contrasta la independencia entre la variable explicativa (factor de exposición) y la variable respuesta o resolución. mediante la prueba de Chi-Cuadrado. Manejo del programa Datos Agrupados: La disposición de la tabla para la entrada de datos es la siguiente: La cuadrícula permite la entrada directa del número de casos dentro de cada posible combinación de categorías o niveles.5 en todas las celdas para evitar problemas de cálculo en las medidas de efecto. se suma 0. Datos Agrupados A partir de datos agrupados se calculan las medidas de efecto básicas en Epidemiología. La tabla está definida por las frecuencias de respuestas positivas y negativas para los grupos de expuestos y no expuestos. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero. Adicionalmente se facilitan los intervalos de confianza para el riesgo relativo poblacional y el odds ratio poblacional. Epidemiología (b|b) à Tablas. Las variables deben ser dicotómicas.

negativos. El nivel de confianza se puede modificar en la ventana de opciones considerándolo = (1-alfa). En cada celda aparece en términos absolutos el número de individuos dentro de cada posible combinación de categorías. Adicionalmente se facilitan los intervalos de confianza para el riesgo relativo poblacional y el odds ratio poblacional. La notación interna que utiliza el programa es la de k tablas 2x2 de la forma siguiente. los porcentajes referidos al total de la tabla. son las técnicas básicas que se utilizan en Meta-Análisis. y j=1. Tablas: Se muestra la tabla de contingencia de las dos variables dicotómicas . mediante la prueba de Chi-Cuadrado. Datos Agrupados (c|(b|b)) Realiza la prueba de Mantel-Haenszel que combina información en Epidemiología de varias tablas 2x2 que estudian el mismo factor de exposición y la misma resolución o respuesta.…. Adicionalmente. El programa calcula. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). Si la variable explicativa (factor de exposición) se localiza en la variable columna.k: . Esta técnica junto con la metodología Logit. por defecto. Las celdas de la tabla no admiten valores faltantes. se pueden dar los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). los porcentajes por columnas corresponden a los porcentajes (riesgos) de los grupos expuestos y no expuestos. Chi-Cuadrado: Se contrasta la independencia entre la variable explicativa (factor de exposición) y la variable respuesta o resolución. Epidemiología (b|b) à Mantel-Haenszel. RR y OR: Se presentan las principales medidas de efecto para variables dicotómicas en Epidemiología: el Riesgo Relativo RR y el Odds Ratio OR.110 No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. con k el número de tablas o estudios (niveles) que hay que combinar. Se contrasta si los valores poblacionales de las medidas de efecto (RR y OR) son diferentes de 1. decimales o alfanuméricos.

0 Factor de exposición Respuesta Sí No Total Sí aj cj s 1j No bj dj s 2j Total r1j r2j nj 111 Esta notación interna se presenta en el interfaz de entrada de la forma: Nivel 1 Res + / Exp+ Res+ / ExpRes. se dan las fórmulas para calcular la homogeneidad de los estudios o niveles. Si se rechaza la hipótesis nula de homogeneidad (y se concluya heterogeneidad). Odds Ratio y Chi-2 de significación son las descritas en la opción anterior de Epidemiología. Riesgo Relativo Mantel-Haenszel El riesgo relativo Mantel-Haenszel se calcula como ∑ ∑ k k a js 2j nj b js1j nj RR MH = j =1 j =1 Para determinar el IC(RRMH) es conveniente trabajar con el transformado logarítmico del RRMH. Odds Ratio Mantel-Haenszel y Chi-2 Mantel-Haenszel de significación se describen a continuación./ Expa1 b1 c1 d1 Nivel 2 a2 b2 c2 d2 Nivel j aj bj cj dj Nivel k ak bk ck dk Las fórmulas para el cálculo en cada nivel del Riesgo Relativo.Manual G-Stat 2. los valores estimados por Mantel-Haenszel son cuestionables./ Exp+ Res. Asimismo. para lo cual es necesario calcular . Las fórmulas del Riesgo Relativo Mantel-Haenszel.

96 ⋅ EE (LnRR MH ) ) ) Odds Ratio Mantel-Haenszel El odds ratio Mantel-Haenszel se calcula como ∑ ∑ k k ajd j nj b jc j nj ORMH = j= 1 j= 1 Para determinar el IC(ORMH) es conveniente trabajar con el transformado logarítmico del RRMH. para lo cual es necesario calcular EE(LnORMH ) = siendo k  a j + d j   aj d j    ∑   j = 1  nj   nj  Aux1 = 2 k ad  2 ∑ j j  j= 1 n j    Aux1 + Aux 2 + Aux3  b + cj  k  a j + d j   b jc j    + j  ∑     j = 1  nj   nj   nj  Aux2 =  k ajd j   k b jc j  2 ∑  ∑   j= 1 n j   j=1 n j     k  b j + c j   b jc j    ∑   j = 1  nj   nj  Aux3 = 2 k bc  2 ∑ j j   j=1 n j     ajd j     nj    .96 ⋅ EE ( LnRR MH )) .112 k EE(LnRR MH ) = j =1 ∑ r1 js1js2 j − ajb jn j n2 j  k a js 2j   k b js1 j  ∑  ∑   j= 1 n j   j=1 n j     con lo que el IC95%(RRMH) viene dado directamente por (exp (LnRR MH − 1. exp (LnRR MH + 1.

0 con lo que el IC95%(ORMH) viene dado directamente por 113 (exp (LnORMH − 1.k. j=1.….Manual G-Stat 2. 96 ⋅ EE (LnORMH ) ) ) Homogeneidad de Riesgos Relativos Se construyen k tablas 2x2 ficticias que tengan por RRj el mismo RRMH en cada estudio o nivel j. de la forma siguiente: Factor de exposición Respuesta Sí No Total con Sí a* j c* j s 1j No b* j d* j s 2j Total r1j r2j nj RR MH = a*s 2 j j b *s1j j Se plantea una ecuación lineal en a*j y de dicha ecuación se resuelven el valor del resto de las celdas: RR MH = (r a*s2 j j 1j − a* s1j j ) a* = j r1 js1jRR MH s2 j + RR MHs1 j b* = r1 j − a* j j c * = s1 j − a* j j d* = r2 j − s1 j − a* j j ( ) ) + (d 2 j 2 − d*  j   d* j  A partir de estos valores se construye el siguiente estadístico de homogeneidad  a − a* j j ∑ j= 1  a* j  k ( ) + (b 2 j − b* j b* j ) + (c 2 j − c* j c* j ) . exp (LnORMH + 1.96 ⋅ EE ( LnORMH )) .

j=1. seguirá una distribución chi-cuadrado con 1 grado de libertad.k.114 Este estadístico se ha definido de forma análoga al estadístico de homogeneidad de Breslow-Day para odds ratio y está en fase experimental de estudio. Este estadístico de homogeneidad puede dar valores negativos.…. pero siguiendo la analogía con Breslow-Day. Homogeneidad Breslow-Day de Odds Ratios Se construyen k tablas 2x2 ficticias que tengan por ORj el mismo ORMH en cada estudio o nivel j. en esos caso el programa escribe en los resultados “No Aplicable”. de la forma siguiente Factor de exposición Respuesta Sí No Total con Sí a* j c* j s 1j No b* j d* j s 2j Total r1j r2j nj ORMH = a*d* j j b*c * j j Se plantea una ecuación cuadrática en a* j y de dicha ecuación se resuelven el valor del resto de las celdas: ORMH = 2 [r a* r2 j − s1j − a* j j 1j [ − a* j ( ] [s 1j − a* j )] ] a* (OR MH − 1) + a* s1j − r2j − s1 jOR MH − r1jORMH + ORMHr1 js1j = 0 j j a* = j − s1j − r2 j − s1 jOR MH − r1jORMH ± AUX1 2 (ORMH − 1) ( ) ( ) AUX1 = s1j − r2 j − s1 jORMH − r1 jORMH 2 − 4(ORMH − 1) ORMHr1 js1j ( ) b* = r1 j − a* j j c * = s1 j − a* j j d* = r2 j − s1 j − a* j j ( ) .

a* j≤r1j y a*j≤s 1j.0 115 La solución de la anterior ecuación para a* j será aquella que verifique a*j ≥0. siendo E aj = [ ] r1 js1 j nj V aj = [ ] r1jr2 js1 js2 j n2 n j − 1 j ( ) Manejo del programa Datos Agrupados: La disposición de la tabla para la entrada de datos es la siguiente: .Manual G-Stat 2. A partir de estos valores se construye el estadístico Breslow-Day de homogeneidad  a − a* j j ∑ j= 1  a* j  k ( ) + (b 2 j − b* j b* j ) + (c 2 j − c* j c* j ) + (d 2 j 2 − d*  j   d* j  ) Este estadístico sigue una distribución chi-cuadrado con 1 grado de libertad. Chi-Cuadrado Mantel-Haenszel El estadístico Chi-Cuadrado Mantel-Haenszel se calcula como k   ∑ aj − E aj   j=1  = k ∑ V aj χ2 MH ( ( )) 2 j =1 [ ] que sigue una distribución Chi-Cuadrado con un grado de libertad.

RR. Diagnóstico (b|b) Contiene un submenú con técnicas de Diagnóstico. que representa la verdadera condición del sujeto. las medidas de efecto RR y OR. tiene como posibles resultados el valor positivo y negativo. Se supone que el test o prueba diagnóstico. Tablas (Datos Agrupados) y curvas ROC (“Receiver Operating Characteristic curves”). en un sujeto. Cada columna está asociada a un estudio. así como su intervalo de confianza y su significación global. con las opciones de Tablas. Esta variable que se intenta pronosticar se conoce también como “Estado de la naturaleza (EN)”.116 La cuadrícula permite la entrada directa de las frecuencias de respuestas positivas y negativas para los grupos de expuestos y no expuestos. Las celdas de la tabla no admiten valores faltantes. al igual que el EN. OR y significación: Se presenta para cada nivel de la variable formadora de capas. Se puede definir el número de estudios o niveles de la variable de estratificación. El botón "Crear" prepara la estructura de la tabla ajustada al número de estudios. decimales o alfanuméricos. la presencia o ausencia de una “enfermedad” (que se considera como variable respuesta). Por defecto aparecen en la tabla unos valores que deben ser sustituidos por los datos del usuario. No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. Diagnóstico (b|b) à Tablas En esta opción se describen las técnicas de diagnóstico que intentan estudiar el comportamiento de un test o prueba diagnóstica (que se considera como variable explicativa) en relación a si pronostica bien o mal. La notación que se utiliza es la siguiente: . negativos.

otros. sólo se prefija n) se puede calcular la prevalencia muestral.0 Test EN + Total + a c c1 b d c2 Total r1 r2 n 117 Los valores a y d representan a aquellos individuos que son pronosticados correctamente. sin embargo sí. Sensibilidad y especificidad La sensibilidad y la especificidad de un test se calculan como Sens = a r1 d r2 Espe = La sensibilidad representa la probabilidad de test positivo en el grupo EN positivo (acierto en “enfermos”) y la sensibilidad la probabilidad de test negativo en el grupo EN negativo (acierto en “sanos”). likelihood ratio y odds ratio.Manual G-Stat 2. r2. . En los casos en que sí dependa y se esté en un estudio transversal. por lo que se utilizan las fórmulas descritas en la opción Análisis / Cualitativa / Una Proporción. referencias bibliográfica) de la prevalencia teórica. es necesario tener una estimación (por otros estudios. c1 ó c2. especificidad. Esta estimación se denota por Prev. Los índices de fiabilidad diagnóstica que se calculan son: sensibilidad. La sensibilidad y la especificidad no dependen de la prevalencia. El cálculo de los intervalos de confianza de la sensibilidad y de la especificidad se realizan teniendo en cuenta que son proporciones. valores predictivos de ocurrencia para cada resultado del test. que viene dada por Prevalenci = a r1 n Algunos de los índices de fiabilidad diagnóstica no dependen de la prevalencia teórica. En estudios transversales (donde no se prefija ningún marginal r1.

96 ⋅ EE ( LnL(+))) . para lo cual es necesario calcular . Likelihood ratio Los Likelihood ratio de “enfermedad” de un test se calculan como L( +) = Sens 1 − Espe 1 − Sens Espe L( −) = Los Likelihood ratio de “enfermedad” no dependen de la prevalencia. En el caso de estudios no transversales es necesario calcularlos a partir de Prev y de los Likelihood ratio. exp (LnL(+) + 1. según se verá a continuación. Esto quiere decir que en estudios transversales las fórmulas anteriores son correctas para el cálculo de VP+ y VP-. Los valores predictivos de “enfermedad” dependen de la prevalencia. El VP. Para determinar el IC(L(+)) es conveniente trabajar con el transformado logarítmico del L(+). para lo cual es necesario calcular EE(LnL( +)) = 1 − Sens Espe + a c con lo que el IC95%(L(+)) viene dado directamente por (exp (LnL(+) − 1.118 Valores predictivos Los valores predictivos de “enfermedad” de un test se calculan como VP + = a c1 b c2 VP − = El VP+ representa la Prob(EN positivo | test positivo).representa la Prob(EN positivo | test negativo). es decir la probabilidad de EN positivo en el grupo de test positivo. es decir la probabilidad de EN positivo en el grupo de test negativo. El cálculo de los intervalos de confianza de los valores predictivos se dará en el caso general a partir de Prev y de los Likelihood ratio.96 ⋅ EE (LnL(+)) ) ) Para determinar el IC(L(-)) es conveniente trabajar con el transformado logarítmico del L(-).

de la forma siguiente: VP+ = Prob(EN+ | Test +) = VP− = Prob(EN+ | Test −) = Prev ⋅ L(+) Prev ⋅ L(+) + 1 − Prev Prev ⋅ L( −) Prev ⋅ L( −) + 1 − Prev Para determinar el IC(VP+) es necesario calcular  EE(Prev)   EE(Sens)   EE(Ines)  EE(VP + ) = (VP + )(1 − VP + )   Sens  +  Ines  +  Prev(1 − Prev)             2 2 2 siendo Ines = 1 − Espe EE(Sens) = a r1   1 − a   r1    r1 EE(Ines) =   1 − d  d  r2  r2   r2 EE(Pr ev) = Prev(1 − Prev) n con lo que el IC95%(VP+) viene dado por ((VP +) − 1. (VP +) + 1.0 119 EE(LnL(−)) = Sens 1 − Espe + b d con lo que el IC95%(L(-)) viene dado directamente por (exp (LnL(−) − 1. 96 ⋅ EE (VP +) .en estudios no transversales. 96 ⋅ EE (LnL(−)) ) ) A partir de los Likelihood ratio y de Prev se pueden calcular VP+ y VP. exp (LnL(−) + 1.96 ⋅ EE (VP + )) Para determinar el IC(VP-) es necesario calcular  EE(Prev)   EE(Sens)   EE(Ines)  EE(VP −) = (VP − )(1 − VP − )   Sens  +  Ines  +  Prev(1 − Prev )             2 2 2 .96 ⋅ EE ( LnL(−))) .Manual G-Stat 2.

96 ⋅ EE (VP − ) . valores predictivos de ocurrencia para cada resultado del test. adicionalmente. se presenta la prevalencia en la muestra. especificidad.120 con lo que el IC95%(VP-) viene dado por ((VP −) − 1. Asimismo. por defecto.96 ⋅ EE (VP −)) Odds ratio El cálculo del odds ratio y de su intervalo de confianza se realiza según las fórmulas dadas en la opción de Epidemiología. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). que OR = L( +) L( −) Manejo del programa Variables: Se identifica la Variable respuesta "Estado de la naturaleza" (EN) o verdadera condición del sujeto en filas y la Variable explicativa “resultado del Test” (prueba diagnóstica) en columnas. . se pueden dar los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). Adicionalmente. likelihood ratio y odds ratio. (VP −) + 1. El programa calcula. En cada celda aparece en términos absolutos el número de casos dentro de cada posible combinación de categorías. Diagnóstico: Aparecen los índices de fiabilidad diagnóstica. no obstante. los resultados positivos del Estado de la naturaleza y del Test deben estar situados en la casilla superior izquierda. En las pestañas posteriores de Tablas y Diagnóstico habrá que comprobar que la diagonal de concordancia viene dada por la casilla superior izquierda y la casilla inferior derecha y que. Tablas: Se muestra la tabla de contingencia dos por dos de dos variables cualitativas dicotómicas. Observar. sensibilidad. ambas dicotómicas. los porcentajes referidos al total de la tabla. Si no es así. ordenar los datos para conseguir dicha disposición.

Manual G-Stat 2. Se incluyen los intervalos de confianza. Este tipo de contraste no suele utilizarse en diagnóstico puesto que normalmente. Los fundamentos teóricos y la formulación son idénticos a los presentados en la opción de análisis anterior con datos a partir de un fichero. Manejo del programa Datos Agrupados: La disposición de la tabla para la entrada de datos es la siguiente: La cuadrícula permite la entrada directa del número de casos dentro de cada posible combinación de categorías o niveles. Diagnóstico (b|b) à Tablas. Los datos agrupados se introducen directamente en una cuadrícula en forma de tabla de 2 filas y 2 columnas. Chi-Cuadrado: Se contrasta la independencia entre el resultado del Test y la variable Estado de la naturaleza EN. Los valores predictivos dependen del valor de la prevalencia muestral. la especificidad y la sensibilidad no. aun siendo estadísticamente significativo el resultado. muchas veces los índices o medidas de fiabilidad diagnóstica no son suficientemente adecuados. La tabla está definida por las frecuencias de resultados del Test positivos y negativos para los dos Estados de la naturaleza. el valor por defecto de alfa es 5% que corresponde a un IC del 95%. Datos Agrupados A partir de datos agrupados se calculan las técnicas estadísticas básicas utilizadas en Diagnóstico. con lo que la tabla es de dos por dos. Por defecto aparecen . Las variables deben ser dicotómicas. mediante la prueba de Chi-Cuadrado. En las opciones.0 121 La prevalencia se puede modelizar en las opciones.

. En las opciones. Adicionalmente. se pueden dar los porcentajes de dichos valores con relación al número total de individuos en una categoría en fila (porcentajes fila). la especificidad y la sensibilidad no dependen. Chi-Cuadrado: Se contrasta la independencia entre el resultado del Test y la variable Estado de la naturaleza EN. Se incluyen los intervalos de confianza. Tablas: Se muestra la tabla de contingencia dos por dos de dos variables cualitativas dicotómicas. los porcentajes referidos al total de la tabla. No dejar en la tabla filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. por defecto. Adicionalmente. mediante la prueba de Chi-Cuadrado. muchas veces los índices o medidas de fiabilidad diagnóstica no son suficientemente adecuadas. La suma de frecuencias de la diagonal de discordancias no debería ser cero. los resultados positivos del Estado de la naturaleza y del Test deben estar situados en la casilla superior izquierda. La prevalencia se puede modelizar en las opciones. valores predictivos de ocurrencia para cada resultado del test. negativos. se presenta la prevalencia en la muestra. Las celdas de la tabla no admiten valores faltantes.122 en la tabla unos valores que deben ser sustituidos por los datos del usuario. El programa calcula. Los valores predictivos dependen del valor de la prevalencia muestral. reordenar los datos para conseguir dicha disposición. especificidad. Se asume que la diagonal de concordancia viene dada por la casilla superior izquierda y la casilla inferior derecha. Este tipo de contraste no suele utilizarse en diagnóstico puesto que normalmente. aun siendo estadísticamente significativo el resultado. likelihood ratio y odds ratio. decimales o alfanuméricos. En cada celda aparece en términos absolutos el número de casos dentro de cada posible combinación de categorías. sensibilidad. en una categoría en columna (porcentajes columna) y del total de individuos (porcentaje total). Diagnóstico: Aparecen los índices de fiabilidad diagnóstica. Si no es así. Asimismo. el valor por defecto de alfa es 5% que corresponde a un IC del 95%.

0 123 Diagnóstico (b|b) à ROC (y|b) Realiza el cálculo de las curvas ROC o curvas de rendimiento diagnóstico. Se tiene. x2. El Área bajo la curva (ABC) de esta curva ROC da una medida del grado de rentabilidad diagnóstica del Test. El ABC varía entre 0 y 1.Manual G-Stat 2. Para ello se ordenan de menor a mayor los distintos valores que toma la variable explicativa. Los tramos que se consideran son los dados por los puntos de corte: <x1. (x1 +x2 )/2.5 del ABC indican diagnósticos inversos. que a j: Verdaderos positivos. . …. (xk-1 +xk)/2. por tanto. donde en el eje horizontal se representa 1-Especificidad y en el eje vertical la Sensibilidad. que se denotan por x1. …. Valores cercanos a 0. La curva ROC es la representación gráfica de estos valores obtenidos. b j: Falsos negativos. en un sujeto. Esta variable que se intenta pronosticar se conoce también como “Estado de la naturaleza (EN)”. se supone que el test o prueba diagnóstico es cuantitativa en vez de dicotómica.5 implican ausencia de rentabilidad diagnóstica. que representa la verdadera condición del sujeto. >xk En cada punto de corte p c se construye una tabla 2x2 de la forma siguiente: Test EN + Total Test>=p c aj cj c1j Test<p c bj dj c2j Total r1j r2j nj donde Test>=p c se interpreta como un test que da resultado positivo y Test<p c se interpreta como un test que da resultado negativo. ….y Test+ d j: Verdaderos negativos. cj: Falsos positivos. xk.k. Valores menores de 0. EN. que son técnicas de diagnóstico que intentan estudiar el comportamiento de un test o prueba diagnóstica cuantitativa (que se considera como variable explicativa) en relación a si pronostica bien o mal.y Test En cada una de estas tablas se calcula la Sens j y la (1-Espe)j con j=1. EN+ y Test+ EN+ y Test EN. la presencia o ausencia de una “enfermedad” (que se considera como variable respuesta). A diferencia de las opciones anteriores de Diagnóstico. Esta técnica se basa en discretizar la variable explicativa en tramos. El EN sigue siendo dicotómica.

donde en el eje horizontal se representa 1-Especificidad y en el eje vertical la Sensibilidad. En opciones se identifica el código del EN relacionado con el valor positivo. . que es el punto con Sensibilidad y Especificidad igual a 1. ROC Gráfico: Se muestra la curva ROC que es la representación gráfica de los valores obtenidos según se indica en la pestaña ROC Tabla. los títulos y los valores mínimo y máximo de los ejes. Una vez dicotomizada la variable explicativa cuantitativa se calculan los índices diagnósticos Sensibilidad y 1Especificidad para los diferentes cortes. Manejo del programa Variables: Se identifica la Variable respuesta dicotómica "Estado de la naturaleza" (EN) o verdadera condición del sujeto y la Variable explicativa cuantitativa “resultado del Test” (prueba diagnóstica). indicándose las Areas bajo la Curva parciales.124 El área bajo la curva ROC se calcula por el método trapezoidal de la forma siguiente: k  Sensj − Sensj−1   ∑ (1 − Espe)j − (1 − Espe)j−1  Sensj−1 +   2   j =1 ( ) El punto de probabilidad de corte óptimo para a partir del valor de la variable explicativa determinar la ocurrencia de la variable respuesta. generalmente "enfermedad”. generalmente "enfermedad". Estas opciones son independientes de las de la pestaña ROC Tabla y deberán igualarse para obtener resultados compatibles. El ABC global se presenta al final de las ABC parciales y en la pestaña ROC Gráfico. ROC Tabla: Para la variable cuantitativa Test se generan sucesivos puntos de corte. será aquel en donde la curva más se acerca a la esquina superior izquierda del gráfico. En opciones se identifica el código del EN relacionado con el valor positivo. El ABC se estima por el método trapezoidal.

Mann-Whitney (Wilcoxon). tiene la expresión .α)% para la diferencia de medias suponiendo igualdad de varianzas.Manual G-Stat 2. Para calcular el IC(1 .0 125 Dos Grupos (b|y) Contiene un submenú con diferentes técnicas estadísticas para una variable explicativa dicotómica o binaria (b) que intenta explicar una variable explicativa cuantitativa (y).gl grados de libertad gl = (n 1 . que tiene por expresión s2 = siendo 2 s1 y s2 2 las varianzas muestrales para cada grupo. se necesita calcular el error estándar de la diferencia de medias que. Dos Grupos (b|y) à t-Student Realiza el intervalo de confianza del parámetro diferencia poblacional de dos medias y un contraste de hipótesis de dos medias mediante la prueba tStudent. con lo que IC(1 − α )% x1 − x 2 = x1 − x 2 ± t1 − α / 2. F-Snedecor. Se incluyen las siguientes pruebas: t-Student. Wilcoxon para datos pareados y Signos para datos pareados. t-Student para datos pareados.α)% para la diferencia de medias suponiendo no igualdad de varianzas. en el supuesto de no igualdad de varianzas.1) + (n 2 – 1) = (n 1 + n2 – 2) . glEE x 1 − x2 proporciona el IC buscado. ( ) [( ) ( )] Para calcular el IC(1 . En segundo lugar con para calcular el IC deseado se necesita el valor de la t-Student t 1-α/2. en el supuesto de igualdad de varianzas. se necesita calcular el error estándar de la diferencia de medias que. tiene la expresión EE x1 − x 2 = ( ) 1  2 1  s  n + n   1 2  siendo x1 y x 2 las medias por cada grupo y s2 la varianza conjunta (“pooled 2 (n1 − 1) s1 + (n2 − 1) s2 2 (n1 − 1) + (n2 − 1) variance”). t-Student y F-Snedecor para datos agrupados.

se construye el estadístico de contraste experimental t dado por t = x1 − x2 EE(x 1 − x 2 ) = x1 − x 2 s1 s + 2 n1 n 2 2 2 .glEE x1 − x2 proporciona el IC buscado.gl con grados de libertad gl dados por la siguiente expresión. Para llevar a cabo el contraste H0: µ1 . se construye el estadístico de contraste experimental t dado por ( ) [( ) ( )] t = x1 − x2 EE(x 1 − x 2 ) = x1 − x 2  1 1 s2  n + n  1 2     que bajo la hipótesis nula sigue una distribución t-Student con grados de libertad gl = (n 1 .1) + (n 2 – 1) = (n 1 + n2 – 2). llamada de Satterthwaite gl = [EE(x − x )] 1 [EE(x )] + n 1− 1 [EE(x )] n −1 4 1 2 4 1 2 1 2 4 con lo que IC(1 − α )% x1 − x2 = x1 − x2 ± t1− α / 2.µ2 = 0 H1: µ1 . Para llevar a cabo el contraste H0: µ1 .µ2 ≠ 0 suponiendo igualdad de varianzas poblacionales.126 EE x1 − x2 = EE x 1 ( ) ( ) 2 + EE x2 ( ) 2 = 2 s1 s 2 + 2 n1 n2 En segundo lugar.µ2 = 0 H1: µ1 .µ2 ≠ 0 suponiendo no igualdad de varianzas poblacionales. para calcular el IC deseado se necesita el valor de la tStudent t 1-α/2.

por defecto. por defecto. El programa asigna. por defecto. . t-Student: Se presenta el intervalo de confianza del parámetro diferencia poblacional de dos medias y los resultados del contraste de hipótesis de dos medias mediante la prueba t-Student. la opción ‘no igual’. por defecto. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . pero puede ser modificado. que es el más habitual. la variable respuesta debe tener desviación típica mayor que cero. . : Establecer si hay diferencia de Edad en relación a los Tratamientos. Opciones: . Ver menú Gráficos. el valor de α= 5%.El tipo de aproximación deseada en la Hipótesis Alternativa. Alfa debe ser >0 y <100.Manual G-Stat 2. . pero puede modificarse. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa dicotómica que forma los dos grupos. Cajas: Gráfico de dos Cajas de la variable respuesta para los dos valores de la variable explicativa. En los dos grupos.El programa asume. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa. igualdad de varianzas entre las variables. Resultados de la prueba t-Student asumiendo igualdad de varianzas. . pero también son habituales los valores α= 1% y α= 10%. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula).0 127 que bajo la hipótesis nula sigue una distribución t-Student con grados de libertad gl de Satterthwaite.En el intervalo de confianza. El programa asigna. El programa asigna. Se detallan en Cuantitativa (y).α). el valor 0.El valor que se quiere contrastar en la Hipótesis Nula.

2300 Desviaciones Típicas: 1.3700 Estimación ---------I. E.2947] t-Student --------Hipótesis Nula: Hipótesis Alternativa: t-Student: p-valor: [-0.6588 1. de la Diferencia de Medias: 0.4230 Dos Grupos (b|y) à t-Student.3709 0.0864 E. diferencia de medias = 0. La prueba t-Student para datos pareados calcula en primer lugar una nueva variable Vardif que es igual a la primera variable Var1 menos la segunda variable Var2.8100 0.9247 1.00% para la diferencia de medias: 0.128 Estimación y Contraste de Dos Medias Poblacionales de EDAD por FARMACO ========================================================================= Variable Respuesta: Variable Explicativa: EDAD FARMACO Grupo 1 2 ---------------------------------------------Tamaños Muestrales 20 20 Medias: 22.C.4568 Grados de Libertad: Diferencia de Medias 38. Para realizar el contraste H0: media(Vardif) = µ0 H1: media(Vardif) ≠ µ0 se calcula el estadístico de contraste t como .6000 22.0000 no igual 0. de las Medias: 0.2666 ---------------------------------------------Varianza Conjunta: 2. Pareados Realiza el intervalo de confianza del parámetro media poblacional de la diferencia de dos variables pareadas y un contraste de hipótesis de una media mediante la prueba t-Student para dos variables pareadas.0.5547.1921 E.3700 +/. al 95. E.0000 0.

Opciones: . .0 t= x − µ0 s n 129 donde es la media y s la desviación típica de la nueva variable. Cajas: Gráfico de Cajas para la diferencia de las dos variables pareadas. El programa asigna.α). El programa operará internamente con la diferencia de las dos variables. . el valor 0. por defecto. Manejo del programa Variables: Se identifica la 1ª Variable pareada y la 2ª Variable pareada. por defecto. t-Student. El programa asigna. El programa asigna.En el intervalo de confianza. .El valor que se quiere contrastar en la Hipótesis Nula. pero puede modificarse. que es el más habitual. que sigue una distribución t-Student con gl = n . la opción ‘no igual’. Pareados: Se presenta el intervalo de confianza del parámetro media poblacional de la diferencia de dos variables pareadas y los resultados del contraste de hipótesis de una media mediante la prueba t-Student para dos variables pareadas. Alfa debe ser >0 y <100. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . el valor de α= 5%.El tipo de aproximación deseada en la Hipótesis Alternativa.1 grados de libertad. Estadísticos: Estadísticos de la diferencia de las dos variables pareadas. Ver menú Gráficos. La variable diferencia debe tener desviación típica mayor que cero. Se detallan en Cuantitativa (y). que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula).Manual G-Stat 2. pero también son habituales los valores α= 1% y α= 10%. ambas cuantitativas y expresadas en las mismas unidades. por defecto.

C. Estadísticos para la variable FC2-FC1 ========================================================================== ------------------------------------Estadístico FC2-FC1 ------------------------------------N 40 Media 61.9772 Mínimo 42.0433 Curtosis Estandarizada -1.00% para la media: t-Student --------Hipótesis Nula: Hipótesis Alternativa: Estadístico de contraste t: p-valor: 61. Resultados descriptivos de la prueba t-Student para datos pareados.9244 [58.7500 Mediana 61.130 : Contrastar si la media de FC2 menos FC1 es superior a 60. La expresión para calcular el IC(1 .2.0000 Desviación Típica 10. inferior al 95.0000 mayor que 1. Estimación y Contraste de Una Media Poblacional para FC2 menos FC1 ======================================================================== Tamaño Muestral: Media: 40 61.0083 0.7500 .8256] media = 60.1598 Dos Grupos (b|y) à F-Snedecor Realiza el intervalo de confianza del parámetro cociente poblacional de dos varianzas y un contraste de hipótesis de dos varianzas mediante la prueba FSnedecor.0000 Asimetría Estandarizada -0.0885 ------------------------------------- Resultados de la prueba t-Student para datos pareados.7500 Estimación ---------I.α)% para el cociente de varianzas es .0000 Máximo 82.

s2 F1− α / 2.gln  2        131  σ2 IC95% 1  σ2  2 siendo 2 s1 y s2 2 las varianzas muestrales para cada grupo donde F1-α/2. que se calculan como el tamaño muestral del grupo con mayor varianza muestral menos uno. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa dicotómica que forma los dos grupos.σ2 = 0 H1: σ1 . s 2 2 { { } } que bajo la hipótesis nula sigue una distribución F-Snedecor siendo gln los grados de libertad del numerador y gld los grados de libertad del denominador. . s2 2 2 mín s1 . la variable respuesta debe tener desviación típica mayor que cero. y gld los grados de libertad del denominador que se calculan como el tamaño muestral del grupo con menor varianza muestral menos uno. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa. gld . Cajas: Gráfico de dos Cajas de la variable respuesta para los dos valores de la variable explicativa. En los dos grupos.σ2 ≠ 0 mediante la prueba F-Snedecor de comparación de varianzas se construye el estadístico de contraste experimental F dado por F= 2 máx s1 .0 2   s1     s2 s2  2 1 =   F1 − α / 2. En el caso de no poder rechazar la hipótesis nula (p-valor > 0.05) se considera que las dos varianzas son iguales (homogéneas). gld.gln. Para llevar a cabo el contraste H0: σ1 . Ver menú Gráficos. gld se calcula a partir de una F-Snedecor siendo gln los grados de libertad del numerador. gln. Se detallan en Cuantitativa (y).Manual G-Stat 2.

: Se desea comprobar si el cociente de varianzas es igual a 1 para la variable respuesta FC2FC1.El valor que se quiere contrastar en la Hipótesis Nula. el valor de α= 5%. . la opción ‘no igual’. . Gráfico de cajas de la opción F-Snedecor. con Farmaco como variable explicativa. El programa asigna. Opciones: . por defecto. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). pero puede modificarse.En el intervalo de confianza.El tipo de aproximación deseada en la Hipótesis Alternativa. .α). El programa asigna. el valor 1. pero también son habituales los valores α= 1% y α= 10%. por defecto. Alfa debe ser >0 y <100. que es el más habitual. El programa asigna. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 .132 F-Snedecor: Se presenta el intervalo de confianza del parámetro cociente poblacional de dos varianzas y los resultados del contraste de hipótesis de dos varianzas mediante la prueba F-Snedecor. por defecto.

2045] cociente de varianzas= 1. Datos A partir de los datos resumidos de tamaño muestral. al 95. 4.Manual G-Stat 2.6642 0.2758 Dos Grupos (b|y) à Agrupados t-Student y F-Snedecor.5553 ----------------------------------------------Cociente de Varianzas: 1. Manejo del programa Datos Agrupados: Los datos necesarios son: Nombre Grupo 1: Nombre Categoría1.4108 9. .6642 Estimación ---------I.0 Resultados de la prueba F-Snedecor. media y desviación típica de cada uno de los grupos.0289 92.C. las opciones Análisis / 2 Grupos (b|y) / t-Student y Análisis / 2 Grupos (b|y) / FSnedecor. Nombre Grupo 2: Nombre Categoría2.0000 no igual 1.00% para el cociente de varianzas: F-Snedecor ---------Hipótesis Nula: Hipótesis Alternativa: Estadístico de contraste F: p-valor: [0. sin el fichero de datos. se puede realizar.6206 Varianzas: 154.6587. Los fundamentos teóricos y la formulación son idénticos a los presentados en las opciones anteriores respectivas con datos a partir de fichero. 133 Estimación y Contraste de Dos Varianzas Poblacionales de FC2FC1 por FARMACO ========================================================================= Variable Respuesta: FC2FC1 Variable Explicativa: FARMACO Grupo 1 2 ----------------------------------------------Tamaños Muestrales 20 20 Desviaciones Típicas: 12.

el valor 1. el valor 1. por defecto. pero puede modificarse.El valor que se quiere contrastar en la Hipótesis Nula. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula).El programa asume. pero puede ser modificado. . El programa asigna. Los dos tamaños muestrales tienen que ser mayores que cero. Desv. por defecto. pero también son habituales los valores α= 1% y α= 10%. la opción ‘no igual’. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 . Alfa debe ser >0 y <100. Media Grupo 2: Valor de media2. que es el más habitual.134 Tamaño Grupo 1: Valor n1.En el intervalo de confianza. por defecto. pero puede modificarse. Media Grupo 1: Valor de media1. El programa asigna. que es el más habitual. igualdad de varianzas entre las variables. por defecto. . por defecto. El programa asigna. Opciones: . En los dos grupos la variable respuesta debe tener desviación típica mayor que cero. Típica Grupo 1: Valor de s1. Desv. . por defecto. Tamaño Grupo 2: Valor n2. t-Student: Se presenta el intervalo de confianza del parámetro diferencia poblacional de dos medias y los resultados del contraste de hipótesis de dos medias mediante la prueba t-Student. El programa asigna. Típica Grupo 2: Valor de s2. F-Snedecor: Se presenta el intervalo de confianza del parámetro cociente poblacional de dos varianzas y los resultados del contraste de hipótesis de dos varianzas mediante la prueba F-Snedecor.El tipo de aproximación deseada en la Hipótesis Alternativa. Opciones: . el valor de α= 5%.El tipo de aproximación deseada en la Hipótesis Alternativa.α). que puede . la opción ‘no igual’. El programa asigna. .El valor que se quiere contrastar en la Hipótesis Nula.

El programa asigna. yi2 los valores de la variable Rta para el grupo 2 de n 2 individuos. De forma análoga UXY. Para establecer si hay diferencias en la variable respuesta con relación a los grupos formados por la variable explicativa se utiliza la prueba U de Mann-Whitney o la prueba W de Wilcoxon. UXY sería el número de veces que una observación “x” (del grupo 1) precede a una observación “y” (del grupo 2).α). 135 que’ (referido al valor . también conocida como prueba de Wilcoxon para dos muestras independientes. considerada como variable respuesta (Rta) y la otra dicotómica. Se tienen dos variables. el valor de α= 5%. teniendo en cuenta que cualquier par con xi1 = yi2 suma 0. pero también son habituales los valores α= 1% y α= 10%. por defecto.5 en el cálculo de UXY y de U YX. Es una prueba no paramétrica. Así. Dos Grupos (b|y) à Mann-Whitney (Wilcoxon) Realiza una comparación entre dos distribuciones de datos mediante la prueba de Mann-Whitney. sería el número de veces que una observación “y” (del grupo 2) precede a una observación “x” (del grupo 1). Alfa debe ser >0 y <100. considerada como variable explicativa (Exp).0 modificarse por ‘mayor que’ o ‘menor que contrasta la hipótesis nula). Dichas pruebas son equivalentes entre sí y en ambas el contraste que se realiza es H0: Las medianas son iguales H1: Las medianas son diferentes (caso bilateral) H1: La mediana del grupo 1 es superior / inferior a la mediana del grupo 2 (caso unilateral) La expresión para el cálculo de la U de Mann-Whitney viene dada por UXY o por UYX donde UXY = # {xi1 < yi2 } UYX = # {yi2 < xi1 } siendo xi1 los valores de la variable Rta para el grupo 1 de n1 individuos. La notación #{ } representa el número de pares que verifican la condición entre llaves. una de ellas cuantitativa no normal u ordinal. el nivel de confianza se toma del valor alfa (nivel de confianza= 100 .Manual G-Stat 2. El número de empates entre .En el intervalo de confianza.

n2 es el tamaño muestral del grupo 2 y n es el tamaño muestral total. El estadístico de contraste se calcula como z= UXY − E[UXY ] V [UXY ] = UYX − E[UYX] V[UYX ] que sigue una distribución normal N(0. El estadístico de contraste se calcula como . n2 es el tamaño muestral del grupo 2 y n es el tamaño muestral total.k siendo k el número de valores distintos donde se produce el empate.. Las expresiones para E[UXY].5 n (n+1). V[W 1] y V[W 2] son E[W1 ] = E[W2 ] = 1 n1 (n + 1) 2 1 n2 (n + 1) 2 V[W1 ] = V[W2 ] = k 1 n1n2  3  3 n − n − ∑ d j − d j  12 n(n − 1)  j= 1  ( ) donde n1 es el tamaño muestral del grupo 1.136 valores “x” e “y” se denota por dj. E[UYX]. Se verifica que UXY + UYX = n1 n 2.. Las expresiones para E[W 1].. E[W 2]. Se verifica que W 1 + W 2 = 0. V[UXY] y V[UYX] son E[UXY ] = E[UYX ] = 1 n1n2 2 V[UXY ] = V[UYX ] = k 1 n1n2  3  3 n − n − ∑ d j − d j  12 n(n − 1)  j=1  ( ) donde n1 es el tamaño muestral del grupo 1.1). con j = 1. La expresión para el cálculo de la W de Wilcoxon viene dada por W 1 o por W 2 con W1 = W2 = grupo1 ∑ Rangos ∑ Rangos grupo2 donde los rangos se calculan en relación a la muestra conjunta y en el caso de empates como promedios de los órdenes de las observaciones empatadas.

Cajas: Gráfico de dos Cajas de la variable respuesta para valores de la variable explicativa. los dos Mann-Whitney (Wilcoxon): Se presentan los resultados del contraste de hipótesis entre dos distribuciones de datos mediante la prueba de Mann-Whitney (Wilcoxon). por defecto.0 137 z= W − E[W1 ] 1 V[W1 ] = W2 − E[W2 ] V[W2 ] que sigue una distribución normal N(0.1). Opciones: . El programa asigna.3125 60. Ver menú Gráficos. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido a la igualdad de distribuciones que contrasta la hipótesis nula). : Comprobar si la distribución de la variable FC2FC1 es diferente para fumadores y no fumadores.0000 59.0417 Mediana 67.Manual G-Stat 2.5000 . Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa. Se detallan en Cuantitativa (y). Estadísticos para la variable FC2FC1 por FUMADOR =========================================================================== ----------------------------------------Grupos 1 2 ----------------------------------------N 16 24 Media 64. la opción ‘no igual’. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa u ordinal y la Variable explicativa dicotómica que forma los dos grupos. Este programa proporciona un pvalor asintótico para esta opción. Resultados descriptivos de la prueba Mann-Whitney (Wilcoxon). La variable respuesta no puede ser constante en los dos grupos.El tipo de aproximación deseada en la Hipótesis Alternativa.

0000.0000 42.0000 ----------------------------------------- Gráfico de cajas de la opción Mann-Whitney (Wilcoxon) Resultados de la prueba Mann-Whitney (Wilcoxon). E[Uxy] = 192.5000.0000 68.6042 23.8847 Mínimo 42.0000 Cuartil Inferior 56.9527 10.0000 Cuartil Superior 72.50 67. Mann-Whitney (Wilcoxon) de FC2FC1 por FUMADOR ====================================================================== Variable Respuesta: FC2FC1 Variable Explicativa: FUMADOR Grupo 2 1 -------------------------------------------Tamaños Muestrales 24 16 Medianas: 59. V[Uxy] = 1308.0000 52.8000 .138 Desviación Típica 10.00 Rangos Medios: 18.3438 -------------------------------------------Estadístico de Mann-Whitney --------------------------Hipótesis Nula: igualdad de distribuciones Hipótesis Alternativa: distribución 2 no igual distribución 1 Uxy = 237.0000 82.0000 Máximo 82.

E[W1] = 492.5000. los valores que están por encima y por debajo del valor supuesto para la mediana. W2 = 373. E[W2] = 328. Pareados Realiza un contraste de hipótesis de la mediana de la distribución de la variable diferencia mediante la prueba de Wilcoxon para datos pareados.Manual G-Stat 2.1).8000 139 Estadístico de contraste de U: p-valor de U: -1.5000. Es una prueba no paramétrica. Para realizar el contraste H0: med(Vardif) = med0 H1: med(Vardif) ≠ med0 se aplica a esta nueva variable la prueba de los Rangos signados para una muestra. por tanto . La prueba de Wilcoxon para datos pareados (o prueba de Rangos signados para datos pareados) calcula en primer lugar una nueva variable Vardif que es igual a la primera variable Var1 menos la segunda variable Var2. para la variable diferencia. Manejo del programa . Se tiene.8000 V[W2] = 1308. V[W1] = 1308. que la prueba de Wilcoxon para datos pareados se basa en contar.2577 0.5000.2085 Dos Grupos (b|y) à Wilcoxon.8000 Estadístico de contraste de W: p-valor de W: -1.2577 0.2085 Estadístico W de Wilcoxon ------------------------Hipótesis Nula: igualdad de distribuciones Hipótesis Alternativa: distribución 2 no igual distribución 1 W1 = 446. El estadístico de contraste sigue una distribución Normal (0.0000. teniendo en cuenta las magnitudes además del signo.0000. V[Uyx] = 1308.0000. Este programa proporciona un p-valor asintótico para esta opción. E[Uyx] = 192.0 Uyx = 146.

que es el más habitual. por defecto. El programa asigna. Se detallan en Cuantitativa (y). Resultados de la prueba de Wilcoxon para datos pareados. Wilcoxon. Pareados: Se presentan los resultados del contraste de hipótesis de la mediana de la distribución de la variable diferencia mediante la prueba de Wilcoxon para datos pareados.0000 . : Realizar la prueba de Wílcoxon para observar si la mediana de la diferencia de FC2 menos FC1 es superior a 60. pero puede modificarse. El programa asigna. Opciones: .El valor que se quiere contrastar en la Hipótesis Nula. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula). el valor 0.0000 mayor que 40 61. por defecto.140 Variables: Se identifica la 1ª Variable pareada y la 2ª Variable pareada. . la opción ‘no igual’. La variable diferencia no puede ser constante con el valor de la mediana de contraste igual a la mediana de la muestra. Wilcoxon para la Mediana Poblacional de FC2 menos FC1 ====================================================================== Tamaño Muestral: Mediana: Wilcoxon. El programa operará internamente con la diferencia de las dos variables. Pareados -----------------Hipótesis Nula: Hipótesis Alternativa: mediana = 60. Estadísticos: Estadísticos de la diferencia de las dos variables pareadas. Cajas: Gráfico de Cajas para la diferencia de las dos variables pareadas. ambas cuantitativas u ordinales y expresadas en las mismas unidades. Ver menú Gráficos.El tipo de aproximación deseada en la Hipótesis Alternativa.

Manual G-Stat 2. La variable diferencia no puede ser constante con el valor de la mediana de contraste igual a la mediana de la muestra. por tanto . Para realizar el contraste: H0: med(Var_dif) = med0 H1: med(Var_dif) ≠ med0 se aplica a esta nueva variable la prueba de los Signos para una muestra.1). Se tiene. los valores que están por encima y por debajo del valor supuesto para la mediana.9741 (con corrección de continuidad) 0. sin tener en cuenta las magnitudes.0 141 Rango medio de valores por debajo del valor a contrastar de la mediana: 20. El estadístico de contraste sigue una distribución Normal (0.8000 Rango medio de valores por encima del valor a contrastar de la mediana: 16. En el caso de datos dicotómicos pareados. Este programa proporciona un p-valor asintótico para esta opción. El programa operará internamente con la diferencia de las dos variables.1650 Dos Grupos (b|y) à Signos. sólo el signo. Es una prueba no paramétrica. para la variable diferencia. La prueba de los Signos para datos pareados calcula en primer lugar una nueva variable Var_dif que es igual a la primera variable Var1 menos la segunda variable Var2. la prueba de los Signos y la de McNemar son equivalentes. que la prueba de Signos para datos pareados se basa en contar.8824 Estadístico de contraste: p-valor: -0. Pareados Realiza un contraste de hipótesis de la mediana de la distribución de la variable diferencia mediante la prueba de los Signos para datos pareados. Manejo del programa Variables: Se identifica la 1ª Variable pareada y la 2ª Variable pareada. ambas cuantitativas u ordinales y expresadas en las mismas unidades. .

El valor que se quiere contrastar en la Hipótesis Nula. mediante la prueba Log-Rank. Dos Grupos (b|y cens) à Log-Rank Realiza una comparación entre dos curvas de supervivencia. por defecto. Se detallan en Cuantitativa (y). Dos Grupos (b|y cens) Abre un submenú con una técnica estadística para una variable explicativa dicotómica o binaria (b) que intenta explicar una variable respuesta cuantitativa con datos censurados por la derecha (y cens). donde la supervivencia representa la probabilidad de sobrevivir a un tiempo dado. El programa asigna. que es el más habitual. se ordenan de forma creciente los k distintos valores exactos (no censurados) de la variable respuesta (“tiempo hasta”). El programa asigna. Opciones: . el valor 0. Pareados: Se presentan los resultados del contraste de hipótesis de la mediana de la distribución de la variable diferencia mediante la prueba de Signos para datos pareados. Para realizar la prueba Log-Rank. Signos. Cajas: Gráfico de Cajas para la diferencia de las dos variables pareadas. la opción ‘no igual’. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido al valor que contrasta la hipótesis nula).El tipo de aproximación deseada en la Hipótesis Alternativa. Ver menú Gráficos. .142 Estadísticos: Estadísticos de la diferencia de las dos variables pareadas. denotando estos tiempos por t1 < t2 < .. < tk En cada uno de estos tiempos se construye una tabla 2x2 con . pero puede modificarse.. por defecto. Se incluye la prueba Log-Rank.

d2j el número de individuos del grupo 2 con dato exacto igual a tj. A partir de las k tablas 2x2 anteriores se construye el estadístico de contraste z k  dj   ∑  d1 j − n1j  j=1 nj    k n1 jn2 jd j n j − d j ∑ j =1 n2 n j − 1 j z= ( ( ) ) que sigue una distribución Normal o el estadístico Chi-2 k    ∑  d − n d j  1j 1j  j= 1 nj    χ2 =  k n1 jn2 j d j n j − d j ∑ j =1 n2 n j − 1 j 2 ( ( ) ) que sigue una distribución Chi-Cuadrado con 1 grado de libertad. Se detallan en Cuantitativa (y). Los individuos a riesgo n 1j del grupo 1 son aquellos que tienen dato exacto mayor o igual que tj. . nj=n1j+n2j. análogamente con los individuos en riesgo del grupo 2.Manual G-Stat 2. Los estadísticos a calcular se definen en las opciones. Estadísticos: Estadísticos de la variable respuesta y de la variable explicativa estratificados por la variable censura.0 Grupo 1 Muertes Supervivientes En riesgo d 1j n 1j-d 1j n 1j Grupo 2 d 2j n 2j-d 2j n 2j Total dj n j-d j nj 143 siendo d 1j el número de individuos del grupo 1 con dato exacto igual a tj. dj=d1j+d2j. El código asociado al dato censurado de la variable censura puede cambiarse en las opciones de las pantallas de resultados. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa junto con la variable dicotómica que contiene el código de dato censurado y la Variable explicativa dicotómica que forma los grupos.

alternativamente. técnicas de regresión y correlación. Modelos Transformados y Regresión Polinómica. . Opciones: . la opción ‘no igual’. el mínimo.El tipo de aproximación deseada en la Hipótesis Alternativa. por tanto. Kaplan-Meier Gráfico: Gráfico con la curva de supervivencia de todos los casos y .La cabecera. Log-Rank: Se presentan los resultados del contraste de hipótesis entre dos curvas de supervivencia mediante la prueba Log-Rank. x|y Abre un submenú con diferentes técnicas estadísticas para una variable explicativa cuantitativa (x) que intenta explicar una variable cuantitativa (y) y técnicas de asociación para dos variables cuantitativas. El programa asigna. máximo e incremento de los ejes X e Y. por defecto.El código asociado a los datos censurados. las de los grupos formados por la variable explicativa. Opciones: .El código asociado a los datos censurados.144 Kaplan-Meier Tabla: Datos de la curva de supervivencia de todos los casos y . Se incluyen las siguientes técnicas: Regresión Lineal Simple. alternativamente. Son. Opciones: .El código asociado a los datos censurados.Estratificación por la variable explicativa.Estratificación por la variable explicativa. las de los grupos formados por la variable explicativa. . . . . el título del eje X y del eje Y. que puede modificarse por ‘mayor que’ o ‘menor que’ (referido a la igualdad de curvas de supervivencia que contrasta la hipótesis nula).

Manual G-Stat 2. Para realizar el contraste H0: ρ = 0 H1: ρ ≠ 0 a través del coeficiente de correlación de Spearman se construye el siguiente estadístico de contraste t = rs n−2 2 1 − rs . De forma adicional se calculan los coeficientes de correlación de Pearson. Para realizar el contraste H0: ρ = 0 H1: ρ ≠ 0 a través del coeficiente de correlación de Pearson. fundamentalmente. se construye el siguiente estadístico de contraste t=r n−2 1 − r2 que sigue una distribución t-Student con n – 2 grados de libertad.2 grados de libertad y para b 1 t(b1 ) = b1 EE(b1 ) sigue una distribución t-Student con n – 2 grados de libertad. El cálculo de los coeficientes b0 y b1 se realiza mediante el método de los mínimos cuadrados. Spearman e intraclase. de forma que para b 0 t(b0 ) = b0 EE(b0 ) sigue una distribución t-Student con n .0 145 x|y à Regresión Lineal Simple Realiza el análisis de regresión lineal simple. La significación del coeficiente de correlación de Pearson coincide con la significación de la pendiente de la ecuación de la recta de regresión. La significación estadística de los coeficientes del modelo se calcula a partir del coeficiente y de su error estándar. proporcionando. los coeficientes de la regresión y su significación.

es posible aplicar la transformación de Box-Cox.2 grados de libertad. Adicionalmente. el programa muestra el coeficiente de correlación intraclase CCI y su significación. el CMR (cuadrado medio residual) y el valor F de los bloques. Dicho coeficiente se calcula creando una disposición de datos intermedia de la forma 1 1 2 2 … … n n 1 2 yn xn 1 2 1 2 y1 x1 y2 x2 y utilizando la técnica Anova un factor con bloques (ver más adelante en el manual en la opción Anova / Anova un factor con bloques).146 que sigue una distribución t-Student con n . el CMG (cuadrado medio entre grupos). Las transformaciones más frecuentes son: Modelo Exponencial Recíproco-y Expresión y = exp(b 0 + b1x ) y = 1 b0 + b1 x 1 x Recíproco-x y = b 0 + b1 . A partir de estos valores se calcula CCI = n(CMB − CMR ) nCMB + 2CMG + (2n − n − 2)CMR La significación del CCI viene dada por la significación del valor F de los bloques. Cuando la variable que se intenta explicar muestra inestabilidad en la varianza (los valores grandes tienen mayor varianza que los valores pequeños) y se desconoce su distribución. que proporciona el CMB (cuadrado medio entre bloques). método diseñado para hallar la mejor transformación de la variable respuesta.

n− 2 ⋅ se 1 x −x + n i 2 n ∑ xi − x i= 1 ( ( ) 2 ) . pero donde sólo se utiliza la variable explicativa original y potencias de ésta. aquella que presenta un coeficiente de determinación R2 mayor. a pesar de hacer las transformaciones anteriores no se consiga linealidad en la nube de puntos. significaciones de éstos y coeficiente R2 del modelo. De todas las posibles transformaciones es habitual escoger como la más adecuada.0 Recíproca-doble Logaritmo-x Multiplicativo Raíz cuadrada-x Raíz cuadrada-y Curva en S 147 1 1 = b0 + b1 y x y = b0 + b1Ln(x) y = b 0x b1 y = b 0 + b1 x y = b0 + b1x 1  y = exp b 0 + b1    x  Todas ellas tienen una expresión analizable mediante un modelo de regresión simple utilizando las variables transformadas. se puede recurrir a modelos de regresión polinómica que son un caso particular de la regresión multivariante. En estos casos.Manual G-Stat 2. Puede que. Las líneas de predicción para valores medios (rojas) del gráfico se calculan como b0 + b1xi ± t1− 0. o bien en función de la representación gráfica de las variables.05 / 2. Además se muestra el huso de predicciones que consta de unas curvas interiores al 95% de predicción para valores medios (color rojo) y de unas curvas exteriores al 95% de predicción de valores individuales ( color azul). Recta de ajuste En el gráfico se muestra la recta de regresión estimada por mínimos cuadrados. existen coeficientes del modelo. de forma análoga a la regresión lineal simple. En los modelos de regresión polinómica.

cuadrado medio del modelo (CMM) y cuadrado medio residual (CMR). suma de cuadrados residual (SCR). Anova en la regresión La tabla Anova del modelo permite establecer la significación global del modelo. suma de cuadrados total (SCT). grados de libertad del modelo (GLM). GLT = n − 1 .n− 2 ⋅ se 1 + 1 x −x + n i n ∑ x −x2 i i=1 ( ( ) 2 ) Los valores xi no se limitan a los valores observados en la muestra. Para su cálculo intervienen distintos estadísticos: suma de cuadrados del modelo (SCM). GLR = GLT − GLM CMM = SCM SCR . Si se calcula el cociente entre SCM y SCT se obtiene el coeficiente de determinación.148 Las líneas de predicción de valores individuales (azules) del gráfico se calculan como b0 + b1x i ± t1− 0.05 / 2. sino a cualquier valor comprendido en el rango experimental. que si se expresa en tanto por ciento representa el porcentaje . la significación del modelo viene dada por F= CMM CMR que sigue una distribución F-Snedecor con GLM = 1 grados de libertad del numerador y GLR = n – 2 grados de libertad del denominador. grados de libertad residual (GLR). CMR = GLM GLR Por último. donde  (∑ xi )(∑ yi )   ∑ xiyi −  n   SCM = 2 (∑ xi ) 2 ∑ xi − n  ( y )2  SCT =  ∑ y2 − ∑ i  i n     SCR = SCT − SCM 2 GLM = 1 . grados de libertad total (GLT).

Opciones: . se muestra el huso de predicciones que consta de unas curvas interiores al 95% de predicción para valores medios (color rojo) y de unas curvas exteriores al 95% de predicción de valores individuales (color azul). Logaritmo-x. Coeficientes de la regresión. Opciones: . Correlación de Spearman con su significación. Correlación de Pearson. Raíz Cuadrada-y. significación de los coeficientes. Recíproco-x.Manual G-Stat 2. Coeficiente de correlación intraclase y significación. La significación del modelo coincide con la pendiente o coeficiente de regresión b1. Estadísticos: Estadísticos univariantes de la variable respuesta y de la variable explicativa. Multiplicativo.El tipo de modelo que se desea ajustar: Lineal. el título del eje X y del eje Y. Exponencial. máximo e incremento de los ejes X e Y. Raíz Cuadrada-x. desviación típica de los residuos.La cabecera. Además. El coeficiente de determinación también se puede calcular como el cuadrado del coeficiente de correlación de Pearson. Posicionando el cursor sobre cualquier punto se obtienen las coordenadas. el mínimo. Curva en S. Se detallan en Cuantitativa (y). Recíproca Doble.0 149 de información que explica el modelo. Recta de Ajuste: Gráfico con la recta de regresión estimada por mínimos cuadrados. Modelo: Resultados de la regresión lineal simple. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa cuantitativa. errores estándar. Recíproco-y. . Anova: Significación de la regresión lineal mediante el análisis de la varianza.

3692 Desviación Típica 9.8482 Coeficiente de Variación 12.3846 137.5581 9.7000 Mediana 74.E.9718 176.E. E.C. de la media Resultados de la regresión lineal simple. t-valor p-valor .0000 147. Modelo de FC2 con FC1 ====================================================================== Número de Casos: 40 Modelo: Lineal ---------------------------------------------------------------Ecuación: FC2 = 76.0000 165.0000 Moda 68.0000 Máximo 96.5081 2.0 40.0000 112.0998 Mínimo 62.0000 53. Estadísticos de la opción regresión lineal simple. Estadísticos ==================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: FC2 FC1 40 -------------------------------------------------Variable FC1 FC2 -------------------------------------------------N 40.0000 Cuartil Superior 83.2804 E. de la Media (*) 1.0000 Asimetría 0.0000 Media Geométrica 75.0000 Cuartil Inferior 68.6570 Curtosis Estandarizada -0.5493 0.0 Media 75.0850 Asimetría Estandarizada 1.150 : Establecer si la variable FC1 está relacionada o explica significativamente la variable FC2.7245 -0.0000 Rango Intercuartílico 15.6445 -------------------------------------------------(*) Usar con propósito de estimación para el I.9500 137.0000 20.4031 + 0.0738 Varianza 90.0000 127.8071 * FC1 ---------------------------------------------------------------Coef.5379 13.4184 0.0000 Rango 34.2196 Curtosis -0.0000 126.9353 -0.0000 137. Regresión Lineal Simple.

4387 38 120.9634 Rho de Spearman 0.5796 r cuadrado (coeficiente de determinación) 33.4204 1.9613 19.4391 0.L. Análisis de la Varianza ====================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: Anova Modelo: Lineal Suma de Cuadrado Variabilidad Cuadrados G.1333 23 102. Medio F-valor p-valor ------------------------------------------------------------------------Modelo 2310.3054 15 147. El coeficiente de determinación se calcula como el cociente entre la suma de cuadrados explicada y la suma de cuadrados total. Regresión Lineal Simple.4000 39 FC2 FC1 40 x|y à Modelos Transformados Calcula el coeficiente de determinación.4239 0.5567 t-valor 4.2101 Error 2356.9613 1 2310.4406 ------------------------------------------------------------------------Total 6878. El coeficiente de determinación se encuentra entre 0 y 1 (ó entre 0 y 100 si se expresa en tanto por ciento). por lo que cuantifica la proporción de variabilidad de la variable respuesta que es explicada por la variable explicativa.4031 14.2266 0. El mejor modelo es el de mayor R cuadrado.0001 ---------------------------------------------------------------r de Pearson (coeficiente de correlación) 0. para distintos modelos de regresión simple.0864 5.8071 0.0001 Pendiente 0.1841 4.Manual G-Stat 2.0002 151 Significación mediante la prueba Anova.3848 0. .1311 p-valor 0.0009E-1 Residual 4567. el porcentaje de información compartida. Los modelos disponibles se encuentran descritos en Análisis / x|y / Regresión Lineal Simple.0 ---------------------------------------------------------------Ordenada 76. R cuadrado. o dicho de otra forma.60% Desviación Típica de los Residuos 10.1958 ------------------------------------------------------------------------Falta de ajuste 2211.

Raíz Cuadrada-y. Logaritmo-x. Recíproco-x.3378 Recíproco-Y 32.05 se tiene que el modelo con dicho término es mejor que sin él. El coeficiente de determinación R2 . Multiplicativo.5561 ---------------------------------- x|y à Regresión Polinómica Realiza un análisis de cuadráticos y cúbicos. por tanto.152 Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa cuantitativa.5389 Raiz Cuadrada-X 33. Recíproco-y. Los modelos son: Lineal.7372 Recíproca Doble 31.8187 Recíproco-X 31. Se contemplan ajustes polinómicos de grado 2 ó 3 según se especifique. Raíz Cuadrada-x. Exponencial. Curva en S. Coeficientes de determinación de modelos transformados. Si la significación del coeficiente de mayor orden es <0. un caso particular de la Regresión Lineal Múltiple. Es. : Establecer los coeficientes de determinación de todos los posibles modelos de regresión entre las variables FC2 y FC1.5974 Exponencial 33. Comparación de Modelos Transformados de Y = FC1 con X = FC2 ====================================================================== Número de Casos: 40 Modelo r-cuadrado(%) ---------------------------------Lineal 33.5000 Curva en S 31. Recíproca Doble. Modelos: Muestra los resultados del coeficiente de determinación para los diferentes modelos construidos. regresión polinómica para modelos bivariantes En la regresión polinómica se contempla como posibles variables explicativas a la variable x y a potencias de ésta.1994 Raiz Cuadrada-Y 33.1088 Multiplicativo 32. Ver fórmulas en Multivariante / Regresión Múltiple.

grados de libertad residual (GLR). . suma de cuadrados total (SCT). Si se calcula el cociente entre SCM y SCT se obtiene el coeficiente de determinación. que si se expresa en tanto por ciento. errores estándar. Opciones: Orden del polinomio: 2 ó 3.Manual G-Stat 2. que sigue una distribución F-Snedecor con GLM = p (con p el orden del polinomio) grados de libertad del numerador y GLR = n – 1 – p grados de libertad del denominador. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa cuantitativa. Modelo: Resultados de la regresión polinómica. Ver fórmulas en Multivariante / Regresión Múltiple. Estadísticos: Estadísticos univariantes de la variable respuesta y de la variable explicativa. significación de los coeficientes. representa el porcentaje de información que explica el modelo. La significación del modelo viene dada por F que se calcula como el cociente entre CMM y CMR. Anova: Resultados de la significación de los modelos mediante el análisis de la varianza. desviación típica de los residuos. Se detallan en Cuantitativa (y).0 153 refleja el porcentaje de variabilidad explicada por el modelo. La tabla Anova del modelo permite establecer la significación global del modelo. Coeficientes de la regresión. Para su cálculo intervienen distintos estadísticos: suma de cuadrados del modelo (SCM). grados de libertad del modelo (GLM). suma de cuadrados residual (SCR). grados de libertad total (GLT). cuadrado medio del modelo (CMM) y cuadrado medio residual (CMR). El estadístico de Durbin-Watson se usa para estudiar la autocorrelación en los residuos.

Modelo ====================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: FC2FC1 EDAD 40 Modelo Polinomial de orden 2 -------------------------------------------------------Coef. E.8510 2. ---------------------------------------------------------------------- .6928% 3.2324 0.1653 10. Orden del Polinomio ====================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: FC2FC1 EDAD 40 ANOVA para Modelos con distinto orden de polinomio ajustado. t-valor p-valor -------------------------------------------------------Ordenada 289. : Comparar los modelos polinómicos de regresión que pueden conformarse con la variable Edad como variable explicativa y la variable FC2FC1 como variable respuesta.1330 0. Regresión Polinómica.0072 2.5419 Comparación de modelos polinómicos con la pestaña Orden de polinomio. ya que pudiera ocurrir que un modelo polinómico de mayor grado no mejorara estadísticamente un modelo polinómico con grado inferior.4859 -1.2172 EDAD^2 0.E. Regresión Polinómica. Resultados de la regresión polinómica de orden 2 en la pestaña Modelo.3239 87.7652 118.5723 0.5706 -------------------------------------------------------r cuadrado (coeficiente de determinación) r cuadrado (ajustado) Desviación Típica de los Residuos Error Absoluto Medio Durbin-Watson 88.0189 EDAD -13.154 Orden del Polinomio: Se facilita una descripción de distintos modelos polinómicos con distinto grado. Opciones: Orden del polinomio: 2 ó 3.8737 1.2555 0.4555 0.

9258 283.L.8982 1.5677 0.3239 EDAD^3 22.8489 0.5678 88.8565 0. Medio F-valor p-valor r cuadrado -------------------------------------------------------------------EDAD 4145.6805 El modelo no mejora significativamente con la utilización de polinomios de grado 2 ó 3.8112 -------------------------------------------------------------------Modelo 4173.Manual G-Stat 2.3325 0.0001E-14 88.2206 EDAD^2 4.0 155 Suma de Cuadrado Fuente Cuadrados G.9258 1 4145.2186 88. .8565 1 4.8982 1 22.

156 .

Este menú contiene las opciones necesarias para realizar las diferentes pruebas Anova. El Análisis de la Varianza (Anova: “Analysis of Variance”) permite comparar las medias de r grupos. Este cociente sigue una distribución F con r . entre otras técnicas asociadas a ella. independientes e idénticamente distribuidos siguiendo una ley normal con media 0 y desviación constante. La hipótesis nula de la prueba Anova de un factor es: H0: Las medias de los k grupos son todas iguales H1: Al menos una de las medias es diferente Esta prueba se basa en la comparación de las sumas de cuadrados medias.1 y n . Ambas sumas son estimaciones independientes de la variabilidad global. Anova Un Factor (a|y) Realiza la prueba Anova un factor. facilita.r grados de libertad. Asimismo. en caso contrario no hay evidencia suficiente para poder rechazarla. El modelo Anova presupone que las varianzas de los grupos son iguales y que los residuos o errores son aleatorios. se tendrá mayor probabilidad de rechazar la hipótesis nula.05.Manual G-Stat 2. En el caso de que se rechace la hipótesis nula de igualdad de . de manera que. si el cociente entre la primera y la segunda es grande. La hipótesis nula de igualdad de medias se rechaza en el caso en el que pvalor<0. las comparaciones múltiples a posteriori. debidas a la variabilidad entre grupos y la debida a la variabilidad intra grupos (dentro de los grupos). siendo r mayor o igual a 2.0 157 Menú Anova Activar la opción Anova del menú principal o mediante Alt+O.

1 ...j j =1i=1 r nj ( ) 2 = ∑ ∑ x2 − ∑ n jx. de qué grupo o grupos provienen esas diferencias.. = x.j − x. por tanto. CMD = GLE GLD El estadístico de contraste para realizar la prueba Anova se construye con F= CME CMD . dentro de los grupos GLD y total GLT son GLE = r . la media global.1 El cuadrado medio entre grupos CME y el cuadrado medio dentro de grupos son CME = SCE SCD . Las sumas de cuadrados son un paso previo para el cálculo del Anova. de forma que xij − x. x . La suma de cuadrados entre grupos SCE. x . como suma de las Utilizando la siguiente igualdad que permite expresar las desviaciones entre los datos observados xij y la media total (“grand mean”) desviaciones de la media del grupo x . j=1 r ( ) 2 SCD = ∑ ∑ xij − x.….j − x. GLT = n . GLD = n .. la suma de cuadrados dentro de grupos SDE y la suma de cuadrados total SCT se calculan del siguiente modo: SCE = ∑ nj x.j ij j= 1i =1 j =1 r nj r 2 SCT = ∑ ∑ xij − x. por nj el número de individuos en cada grupo j = 1.j y la media total más las desviaciones entre los datos observados y la media del grupo.. j =1i=1 r nj ( ) 2 donde se denota por r al número de grupos.r. Los grados de libertad entre grupos GLE.158 medias se puede determinar mediante comparaciones múltiples a posteriori. la variabilidad de los datos (dada por SCT) se expresa como la suma de la variabilidad explicada debida a los grupos (a las medias) dada por SCE más la variabilidad dentro de los grupos (variabilidad residual o variabilidad no explicada) dada por SCD.r ..j ( ) ( ) se puede demostrar que SCT = SCE + SCD y. + xij − x. j la media de cada grupo y x .

0 159 que se distribuye según una F-Snedecor con GLE grados de libertad del numerador y GLD grados de libertad del denominador. más variabilidad explica el modelo. las medias de la variable cuantitativa. Cuadrado Medio GLE CME F-valor p-valor F p GLD CMD GLT CMD .L.Manual G-Stat 2. Una medida relativa de la variabilidad explicada por los grupos es el cociente R2 = SCE SCT que se denomina coeficiente de determinación.error estándar basado en cada una de las varianzas individuales. menos variabilidad no explicada o residual. junto con su error estándar y sus intervalos de confianza calculados según distintos métodos. por tanto. Queda claro que cuanto más próximo esté de 1. Existen las siguientes opciones: Ninguno: no se muestra ningún intervalo.error estándar basado en la varianza conjunta (pooled). este coeficiente estará entre cero y uno. La información anterior se suele disponer en forma de tabla: Suma de Cuadrados Entre Grupos Dentro Grupos Total Medias e IC Se muestran para cada uno de los grupos. xj ± nj - CMD nj Errores Estándar (individual): intervalos dados por la media +/. y. Errores Estándar (agrupado): intervalos dados por la media +/. Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. En esta opción el error estándar para la media de cada grupo i y los límites del intervalo vienen dados por SCE SCD SCT G. En esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por .

r nj 2 - CMD nj Intervalos Scheffé: intervalos basados en el método de Scheffé. n −r nj - CMD nj Intervalos HSD de Tukey: intervalos basados en el método de Tukey de diferencia “honradamente” significativa (honestly significant difference = HSD). n j −1 s2 j nj Intervalos LSD: intervalos basados en el método de Fisher de mínima diferencia significativa (least significant difference = LSD). Si se denota por q a la función “rango estudentizado inversa”. x j ± F1 − α. 1. x j ± t1− α / 2. donde se comparan cada par de medias con una confianza prefijada. n−1. n −r nj nj Intervalos de Confianza (individual): intervalos de confianza para cada media basados en la varianza individual. x j ± t1− α / 2. En esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por CMD CMD .160 s2 j nj - . donde se calculan todos los contrastes con al menos una confianza prefijada. en esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por CMD 1 . En esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por s2 j nj - . En esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por CMD . x j ± F1− α. n −r r nj nj . xj ± s2 j nj Intervalos de Confianza (agrupado): intervalos de confianza para cada media basados en la varianza conjunta. En esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por CMD CMD . r. x j ± q1− α. donde se comparan cualquier par de medias con una confianza prefijada.

En esta opción el límite viene dado por F1 − α. αb = r (r − 1) nj 2 Comparaciones Múltiples Se presentan pruebas a posteriori para determinar de qué grupo provienen las diferencias detectadas en el ANOVA. donde se comparan cada par de medias con una confianza prefijada. n− r  CMD  1  + 1  ni n j  2   HSD de Tukey: basado en el método de Tukey de diferencia “honradamente” significativa (honestly significant difference = HSD). n −r nj CMD α . En esta opción el error estándar para la media de cada grupo j y los límites del intervalo vienen dados por CMD . donde se comparan cualquier par de medias con una confianza prefijada.Manual G-Stat 2. n− r. En la pantalla de opciones se selecciona el método que se desee para la formación de grupos homogéneos de las medias. En esta opción el límite viene dado por 2 ⋅ F1 − α. 1. En esta opción el límite viene dado por q1− α. r − 1. x j ± F1− αb . 1. donde se calculan los contrastes seleccionados con al menos una confianza prefijada. Existen las siguientes posibilidades: LSD: basado en el método de Fisher de mínima diferencia significativa (least significant difference = LSD). n− r 2 ⋅ (r − 1) CMD 2 1   + 1  ni n j    . donde se calculan todos los contrastes con al menos una confianza prefijada. r CMD 2 1   + 1  ni n j    - Scheffé: basado en el método de Scheffé. Mediante un asterisco se señalan los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes.0 - 161 Intervalos de Bonferroni: intervalos basados en el método de Bonferroni.

en primer lugar. El estadístico de Cochran se calcula como máx s2 j ∑ s2 j El estadístico de Bartlett se calcula como { } ( ) ∑ n j − 1 Lns2 − ∑ n j − 1 Lns2 j  1 1 1 ∑ 1+ − 3(r − 1)  n j − 1 ∑ nj − 1  ( ) ( ) ( )    con s 2 = CMD. Para calcular el estadístico de Levene se realiza. n− r  CMD  1  + 1 2  ni n j    αb = α r (r − 1) 2 Homocedasticidad El ANOVA requiere que la variabilidad dentro de los grupos sea homogénea (hipótesis de homocedasticidad). . la nueva variable respuesta es xij − x. La hipótesis nula sería la homogeneidad de los grupos (homocedasticidad) y la alternativa la no homogeneidad (heterocedasticidad). En el caso de que se obtenga una p<0. Bartlett y Levene. j En segundo lugar se realiza un Anova de un factor con esta nueva variable respuesta.05 se tendría que no se verificaría este supuesto.ej. considerando el valor absoluto de la diferencia entre el valor original y la media del grupo a la que pertenece la observación. la logarítmica) de los datos de la variable cuantitativa y luego aplicar el ANOVA. Se presentan tres pruebas que contrastan este aspecto: C de Cochran. con lo que habría que intentar una transformación (p.162 Bonferroni: basado en el método de Bonferroni. una transformación de la variable respuesta. El valor F de dicho Anova es el estadístico F de Levene. Es decir. 1. donde se calculan los contrastes seleccionados con al menos una confianza prefijada. En esta opción el límite viene dado por 2 ⋅ F1 − αb.

Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de la variable explicativa o factor. La variable respuesta no puede ser constante.0 Manejo del programa 163 Variables: Se identifica la Variable respuesta cuantitativa y la Variable explicativa cualitativa que forma los grupos. para cada uno de los niveles del factor. Así. . Se detallan en Cuantitativa (y). las medias de la variable respuesta. Ver menú Gráficos. pueden verse los valores de la variable respuesta observados. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa. La variable explicativa debe tener dos o más grupos. Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. Este gráfico permite tener una aproximación visual de cuál es el efecto del factor sobre la variable respuesta respecto de su media y de su dispersión.Manual G-Stat 2. el mínimo.La cabecera. el título del eje X y del eje Y. máximo e incremento del eje Y. Opciones: . Cajas: Gráfico de Cajas de la variable respuesta para los distintos valores de la variable explicativa. junto con sus errores estándar y sus intervalos de confianza calculados según distintos métodos. que aparecen en el eje X. Anova: Resultados del Análisis de la Varianza para la comparación de medias de los distintos grupos. Medias e IC: Se muestran para cada uno de los grupos.

las medias de la variable cuantitativa. pero también son habituales 90% y 99%. Mediante un asterisco se señalan los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes. Scheffé. Intervalos de Confianza (agrupado). Comparaciones Múltiples: Resultados de las pruebas a posteriori para determinar de qué grupo o grupos provienen las diferencias detectadas en el Anova. el título del eje X y del eje Y. junto con sus intervalos de confianza calculados según distintos métodos. pero también son habituales 90% y 99%. Este programa se basa en los resultados de las comparaciones dos a dos obtenidas. El nivel de confianza debe ser >0 y <100. Intervalos Scheffé e Intervalos Bonferroni .Método: LSD. . Bonferroni. máximo e incremento del eje Y.La cabecera. Intervalos HSD de Tukey. Homocedasticidad: Resultados del contraste de la homogeneidad de la variabilidad dentro de los grupos mediante las pruebas C de Cochran. . El nivel de confianza debe ser >0 y <100. Intervalos de Confianza (individual). Opciones: . Bartlett y Levene.Nivel de confianza: Por defecto es 95%. Gráfico de Medias: Se muestran para cada uno de los grupos.Método: Son los dados en la pestaña “Medias e IC”. HSD de Tukey. . pero también son habituales 90% y 99%.Nivel de confianza: Por defecto es 95%. Residuos vs Predicciones: Se representan los residuales frente a los valores que predice el modelo. el mínimo. El nivel de confianza debe ser >0 y <100. Opciones: .164 Opciones: . Intervalos LSD.Nivel de confianza: Por defecto es 95%. Este gráfico sirve para poder detectar . Errores Estándar (agrupado).Método: Ninguno. Errores Estándar (individual).

1183 7.0000 42. : Se desea realizar la prueba Anova un factor de la variable FC2FC1 con la variable Status como explicativa. el mínimo.0000 69. Opciones: .1667 Mediana 59.5644 Mínimo 42.0000 74. . Estadísticos para la variable FC2FC1 por STATUS ====================================================================== Grupos 1 2 3 ---------------------------------------------------N 17 11 12 Media 61.0 165 falta de homocedasticidad (heterocedasticidad).La cabecera.0000 53. el título del eje X y del eje Y. Estadísticos de la opción Anova Un Factor.0000 Máximo 82. máximo e incremento del eje Y.0000 Desviación Típica 11.0000 82.Manual G-Stat 2.8913 10.0000 60.0000 Residuos frente a Predicciones de la opción Anova Un Factor. La banda de residuos debería ser similar en dispersión y simetría a lo largo de todos los predichos.3529 68.4545 56.

6119 4.) 4699.4669 -------------------------------------------------------------------------Total (corr. LSD al 95. Anova Un Factor ========================================================================== Variable Respuesta: FC2FC1 Variable Explicativa: STATUS Número de Casos: 40 -------------------------------------------------------------------------Suma de Cuadrado Cuadrados G.2237 2 435.L. Anova Un Factor ====================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: FC2FC1 STATUS 40 Tabla de Medias con I. Medio F-valor p-valor -------------------------------------------------------------------------Entre Grupos 871.5000 39 ------------------------------------------------------------------------- Medias e IC de la opción Anova Un Factor con los intervalos LSD.166 Cajas de la opción Anova Un Factor.C.2763 37 103.0225 Dentro Grupos 3828.2102 0. Resultados de la prueba Anova Un Factor.0% --------------------------------------------------------------- .

2403 74.E.4545 X -------------------------------------- .3529 2.6687 3 12 56.4545 3.4670 56.0669 62.2170 62.7500 167 Gráficos de Medias con Intervalos errores estándar Comparaciones Múltiples LSD de la opción Anova Un Factor.Manual G-Stat 2.3529 XX 2 11 68.3516 2 11 68. Límite Límite STATUS N Media (agrupado) Inferior Superior --------------------------------------------------------------1 17 61.3542 66. Comparaciones Múltiples ====================================================================== Variable Respuesta: FC2FC1 Variable Explicativa: STATUS Número de Casos: 40 Método: LSD al 95.00% -------------------------------------Grupos STATUS N Media Homogéneos -------------------------------------3 12 56.1667 X 1 17 61.1163 --------------------------------------------------------------Total 40 61. Anova Un Factor.0 E.1667 2.9364 50.

Homocedasticidad de la opción Anova Un Factor.3465 FC2FC1 STATUS 40 P-valor = 0.9752 1 VS 3 5. Homocedasticidad ====================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: Prueba C de Cochran: 0.4155 Prueba de Bartlett: 1. media y desviación típica de cada uno de los grupos.2879 *8. Anova Un Factor (a|y). Los fundamentos teóricos y la formulación son idénticos a los .1016 7.7708 2 VS 3 *12.1863 7.5101 Residuos vs Predicciones de la opción Anova Un Factor.6692 P-valor = 0. Anova Un Factor. se puede realizar. la opción Anova Un Factor.Límite -------------------------------------1 VS 2 -7. Datos Agrupados A partir de los datos resumidos de tamaño muestral. sin el fichero de datos.6032 -------------------------------------* Diferencia estadísticamente significativa.168 Contraste Diferencia +/.

por defecto. Los datos. excepto la etiqueta. Manejo del programa Datos Agrupados: Los datos necesarios son: Número de grupos. Etiqueta de cada grupo. Tamaño de cada grupo. tres grupos con datos ficticios que hay que cambiar. .Manual G-Stat 2. Cada vez que se redefinen las dimensiones de la tabla aparecen los valores por defecto. Desviaciones típicas de cada grupo. En la pantalla de entrada de datos agrupados. No dejar filas o columnas con todos los valores faltantes o con todos los valores iguales a cero. deben ser numéricos.0 169 presentados en las opciones anteriores respectivas con datos a partir de fichero. aparecen. Media de los grupos. El resto de las pestañas se maneja igual que en la opción Anova anterior (sin datos agrupados).

el estadístico de contraste de Kruskal-Wallis H’ se calcula como: n(n + 1 ) m=1 nm k 12 ∑ r 1 H' = [R m − E[R m ]]2 3 1− j= 1 ∑ dj − d j n3 − n ( ) .r. Asimismo. m = 1. este contraste funciona muy bien. siendo r el número de grupos. asignando el rango medio en caso de empates. a cada observación se le asigna el rango según el orden que ocupa la observación en el conjunto total de los datos. facilita comparaciones múltiples a posteriori según el método de Dunn. el Anova de un factor es muy robusto y sólo se ve afectado cuando las desviaciones típicas difieren en gran magnitud. En el caso de que se rechace la hipótesis nula de igualdad de medianas se puede determinar mediante comparaciones múltiples a posteriori. Como paso previo al cálculo del estadístico de Kruskal-Wallis.05. de qué grupo o grupos provienen esas diferencias. Es la prueba no paramétrica análoga a la prueba paramétrica Anova. y se calculan el valor medio de los rangos E[Rm] y el rango medio R m como E[R m ] = nm(n + 1) 2 Rm = Rm nm Por último.170 Kruskal-Wallis (a|y) Realiza la prueba no paramétrica de Kruskal-Wallis. También es adecuado cuando las desviaciones típicas de los diferentes grupos no son iguales entre sí.…. Las hipótesis de la prueba de Kruskal-Wallis son H0: Las k medianas son todas iguales H1: Al menos una de las medianas es diferente La prueba de Kruskal-Wallis proporciona información en cuanto a la posible igualdad de medianas entre grupos y permite rechazar esta hipótesis si pvalor<0. A partir de estos rangos se define Rm como la suma de rangos de cada grupo m. Incluso cuando las poblaciones son normales. sin embargo. La prueba de Kruskal-Wallis es la más adecuada para comparar poblaciones cuyas distribuciones no son normales.

máximo e incremento del eje Y. Esta diferencia viene dada por Ri − R j > z 1 12(n − 1) n n2 − 1 − t d3 − d   1 + 1  ∑ m  m     m= 1   ni n j    α 1− k (k −1) ( ) ( ) donde R i es el rango medio del grupo i. .…. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa u ordinal y la Variable explicativa cualitativa que forma los grupos. Opciones: . alfa el nivel de significación. que sigue una distribución Chi-Cuadrado con r . pueden verse los valores de la variable respuesta observados. t el número de valores i distintos de la variable respuesta y dm el número de empates para el valor m de la variable respuesta. el título del eje X y del eje Y.Manual G-Stat 2.1 grados de libertad. que aparecen en el eje X.0 171 siendo dj el número de empates en j = 1. k el número de grupos. Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de la variable explicativa o factor. n el tamaño del grupo i. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa.k con k el número de valores distintos de la variable respuesta. para cada uno de los niveles del factor. z es el valor de la distribución normal unilateral izquierda. Para llevar a cabo esta prueba se establece la diferencia mínima entre los rangos medios de dos grupos para decretar la significación estadística a un nivel alfa determinado. La variable explicativa debe tener dos o más grupos.La cabecera. Este gráfico permite tener una aproximación visual de cuál es el efecto del factor sobre la variable respuesta respecto de su media y de su dispersión. Para realizar comparaciones múltiples a posteriori de los grupos se utiliza la prueba de Dunn. n el tamaño de la muestra. Se detallan en Cuantitativa (y). Este programa proporciona un p-valor asintótico para esta opción. Así. La variable respuesta no puede ser constante. el mínimo.

Este programa se basa en los resultados de las comparaciones dos a dos obtenidas.5000 27.5000 14. El nivel de confianza debe ser >0 y <100. Opciones: . Resultados de la pestaña Kruskal-Wallis.Nivel de confianza: Por defecto es 95%.172 Cajas: Gráfico de Cajas de la variable respuesta para los distintos valores de la variable explicativa.0000 19.6250 ----------------------------------------------------Estadístico de Kruskal-Wallis (sin corrección por empates): Estadístico de Kruskal-Wallis (con corrección por empates): Grados de Libertad: 2 p-valor: 0. Comparaciones Múltiples: Resultados de las comparaciones múltiples a posteriori por el método de Dunn para determinar de qué grupo o grupos provienen las diferencias detectadas en la prueba de Kruskal-Wallis. pero también son habituales 90% y 99%.0240 7. : Se desea realizar la prueba de Kruskal-Wallis de la variable FC2FC1 con la variable Status como explicativa. Kruskal-Wallis ====================================================================== Variable Respuesta: Variable Explicativa: Número de Casos: FC2FC1 STATUS 40 ----------------------------------------------------Grupos N Suma de Rangos Rm Rango Medio ----------------------------------------------------1 17 338.8824 2 11 306. Kruskal-Wallis: Resultado de la prueba de Kruskal-Wallis. Mediante un asterisco se señalan los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes. Ver menú Gráficos.4606 .8636 3 12 175.4424 7.

2500 X ----------------------------------------------------------------------------Contraste Diferencia +/. en caso contrario no hay evidencia suficiente para poder rechazarla. un segundo al de pertenecer a un grupo u otro SCG y un tercero con origen desconocido residual SCR. La hipótesis nula de igualdad de medias se rechaza en el caso en el que p-valor<0. facilita.1818 10. El estadístico de contraste que se usa es el F para los grupos.Límite -------------------------------------2 VS 1 5. El programa proporciona la significación del factor y del bloque.5000 X 3 12 25. las comparaciones múltiples a posteriori.5461 3 VS 2 -9. entre otras técnicas asociadas a ella. El Análisis de la Varianza de un factor con bloque compara medias entre distintos grupos y se basa en descomponer la variabilidad total en tres componentes: uno que se atribuye al hecho de pertenecer a un bloque u otro SCB. Comparaciones Múltiples ====================================================================== Variable Respuesta: EDAD Variable Explicativa: STATUS Número de Casos: 40 Método: Dunn al 95.6757 -------------------------------------* Diferencia estadísticamente significativa. 173 Anova Un Factor con Bloque (a bloque|y) Realiza la prueba Anova un factor con bloque. Asimismo.7500 10. de qué grupo o grupos provienen esas diferencias .0 Resultados de la prueba de comparaciones múltiples a posteriori de Dunn. En el caso de que se rechace la hipótesis nula de igualdad de medias se puede determinar mediante comparaciones múltiples a posteriori.8234 3 VS 1 -4.0% ---------------------------------------Grupos EDAD N Rango Medio Homogéneos ---------------------------------------2 11 15. Kruskal-Wallis.3182 X 1 17 20. Se supone que la variable explicativa es un factor fijo y que la variable bloque es un factor aleatorio.9318 11.05.Manual G-Stat 2.

( ) −1 Xt y g SCR = (y − Xb ) (y − Xb ) . SCG (suma de cuadrados de la variable que forma los grupos). CMR (cuadrado medio residual). g asociadas a las variables dummy de la variable que forma los bloques con rb niveles. SCR (suma de cuadrados residual). las asociadas a las variables dummy de la variable explicativa con rg niveles. . GLB = rb − 1 . El estadístico Fg sigue una distribución F de Snedecor con grados de libertad del numerador GLG y grados de libertad del denominador GLR. Fb (estadístico de contraste para la variable bloque) y F (estadístico de contraste para la g variable que forma los grupos) son: SCT = y − y y − y SCG = SCT − y − Xgb g t ( )( t ) bg = X t Xg g ( )t (y − Xgbg ) . Fg = CMR CMR El estadístico de contraste Fb sigue una distribución F de Snedecor con grados de libertad del numerador GLB y grados de libertad del denominador GLR. SCB (suma de cuadrados de la variable bloque). las medias de la variable cuantitativa. con X a la matriz de n filas por (1+r g-1+r b 1) columnas resultante de añadir (rb-1) columnas a la matriz anterior X . CMG (cuadrado medio de la variable que forma los grupos). CMB (cuadrado medio de la variable bloque). b = X X t ( ) −1 Xty SCB = SCT − SCG − SCR GLT = n − 1 . junto con su error estándar y sus intervalos de confianza calculados según distintos métodos.174 Si se denota por y al vector con los valores de la variable respuesta. GLR = GLT − GLB − GLG CMB = SCB SCG SCR . GLR (grados de libertad residual). GLT (grados de libertad total). con Xg a la matriz de n filas por (1+r g-1) columnas con la primera columna todo de unos y las restantes (rg-1) columnas. CMR = GLB GLG GLR Fb = CMB CMG . Se tiene que las expresiones para SCT (suma de cuadrados total). CMG = . GLG (grados de libertad de la variable que forma los grupos). Medias e IC Se muestran para cada uno de los grupos. GLG = rg − 1 . GLB (grados de libertad de la variable bloque). Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”.

si no es así el programa devuelve un mensaje de error... La matriz X* es una matriz de dimensiones n por n formada por rg bloques de dimensión n/rg por n/rg iguales a cero y bloques ABLOQ de dimensión n/rg por n/rg en la diagonal principal.. 1.. ... intervalos Scheffé..Manual G-Stat 2. intervalos LSD.   a a a a + b   con a= CMB − CMR y b = CMR n / rb Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa. Para la aplicación de esta técnica es necesario que los datos estén balanceados para los dos factores. Por ejemplo. esto significa que todas las casillas de la posible interacción a*b tengan el mismo número de casos. y las componentes relativas a la otra variable explicativa es el inverso del número de categorías de dicha variable explicativa.. si la variable que forma los grupos tiene dos categorías y la variable que forma los bloques también tiene dos categorías. aunque el cálculo de los errores estándar viene dado por l ⋅ X tX *X ( ) −1 ⋅ lt donde l es un vector para cada posible media con (1+(rg-1)+(rb-1)) coordenadas. 1/2). . a   a a + b . intervalos HSD. las componentes relativas a cada variable explicativa es 1 en la correspondiente variable dummy y cero en caso contrario. Existen las siguientes posibilidades: ninguno. la Variable explicativa cualitativa y la Variable bloque también cualitativa. . intervalos de Bonferroni. 0.0 175 En la pantalla de opciones se selecciona el método que se desee para el cálculo de los intervalos de las medias.. errores estándar. intervalos de confianza. Las fórmulas son análogas a las dadas en Anova / Anova / Medias e IC.. para la primera categoría de la variable que forma los grupos el vector l es (1. . a  ABLOQ =  . donde la primera componente es uno.. siendo a + b a . Sólo se calculan medias para el factor fijo. 1/2) y para la segunda categoría de la variable que forma los grupos el vector l es (1..

Se detallan en Cuantitativa (y). el mínimo. Ver menú Gráficos.176 Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa. Medias e IC: Se muestran para cada uno de los grupos. Cajas: Gráfico de Cajas de la variable respuesta para los distintos valores de la variable explicativa. máximo e incremento del eje Y. pero también son habituales 90% y 99%. pueden verse los valores de la variable respuesta observados. Este gráfico permite tener una aproximación visual de cuál es el efecto del factor sobre la variable respuesta respecto de su media y de su dispersión. .Método: Ver opción Anova un Factor.Método: Ver opción Anova un Factor. Opciones: . El nivel de confianza debe ser >0 y <100. para cada uno de los niveles del factor. Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. .La cabecera. junto con sus intervalos de confianza calculados según distintos métodos. Anova: Resultados del Análisis de la Varianza de un factor con bloque para la comparación de medias de los distintos grupos.Nivel de confianza: Por defecto es 95%. las medias de la variable respuesta. Gráfico de Medias: Se muestran para cada uno de los grupos. que aparecen en el eje X. el título del eje X y del eje Y. Opciones: . junto con su error estándar y sus intervalos de confianza calculados según distintos métodos. las medias de la variable respuesta. Opciones: . Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de la variable explicativa o factor. Así.

Nivel de confianza: Por defecto es 95%.La cabecera. . Opciones: .Manual G-Stat 2. pero también son habituales 90% y 99%.La cabecera.Nivel de confianza: Por defecto es 95%. Mediante un asterisco se señalan los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes. pero también son habituales 90% y 99%. máximo e incremento del eje Y. El nivel de confianza debe ser >0 y <100. Comparaciones Múltiples: Resultados de las pruebas a posteriori para determinar de qué grupo o grupos provienen las diferencias detectadas en el Anova.0 177 . el título del eje X y del eje Y. máximo e incremento del eje Y. el título del eje X y del eje Y. El nivel de confianza debe ser >0 y <100. Opciones: . . el mínimo. Este programa se basa en los resultados de las comparaciones dos a dos obtenidas.Método: Ver opción Anova un Factor. el mínimo. . La banda de residuos debería ser similar en dispersión y simetría a lo largo de todos los predichos. Este gráfico sirve para poder detectar falta de homocedasticidad (heterocedasticidad). Residuos vs Predicciones: Se representan los residuales frente a los valores que predice el modelo.

en los casos IB=27 y IB=30. Para que el diseño esté balanceado cambiar la variable Sexo=2. . Farmaco como variable explicativa y Sexo como variable bloque. Dispersión en la opción Anova Un Factor con Bloques.178 : Realizar la prueba Anova un factor con bloques con la variable FC2 como variable respuesta. Variables en la opción Anova Un Factor con Bloques.

3711 0. Comparaciones Múltiples ====================================================================== Variable Respuesta: Variable Explicativa: FC2 FARMACO .0% ----------------------------------------------------------Límite Límite FARMACO n Media E.9500 7.0946 -------------------------------------------------------------------Total (corr.Manual G-Stat 2.L.0306 153.0 Resultados del Anova Un Factor con Bloques.4000 1 2190. LSD al 95. Medio F-valor p-valor -------------------------------------------------------------------Entre Bloques 2190.5000 0.C.) 6878.8694 ----------------------------------------------------------Total 2 137.1784 0. Anova Un Factor con Bloques ============================================= Variable Respuesta: Variable Explicativa: Variable Bloque: Número de Casos: FC2 FARMACO SEXO 40 Tabla de medias con I.6100 121. Anova Un Factor con Bloques. Anova Un Factor con Bloques ============================================= Variable Respuesta: Variable Explicativa: Variable Bloque: Número de Casos: FC2 FARMACO SEXO 40 179 Anova -------------------------------------------------------------------Suma de Cuadrado Cuadrados G.6752 Residual 4665.5000 37 126.4000 39 Medias e IC de la opción Anova Un Factor con Bloques con los intervalos LSD.3694 2 20 138.4500 7.5000 1 22.0002 Entre Grupos 22.5306 152.4000 17. Inferior Superior ----------------------------------------------------------1 20 136.E.7000 Comparaciones múltiples LSD de la opción Anova Un Factor con Bloques.6100 123.

La prueba de Friedman es la análoga no paramétrica del Anova de un factor con muestras (bloques) pareadas.k. un segundo al de pertenecer a un grupo u otro y un tercero con origen desconocido. Friedman (a bloque|y) Realiza la prueba no paramétrica de Friedman.0% ---------------------------------------Grupos FARMACO n Media Homogéneos ---------------------------------------1 20 136.1949 -------------------------------------* Diferencia estadísticamente significativa. Se supone que la variable explicativa tiene k niveles y que hay b bloques.…. Se basa en descomponer la variabilidad total en tres componentes: uno que se atribuye al hecho de pertenecer a un bloque u otro. j=1.4500 X ---------------------------------------Contraste Diferencia +/.C. Estos rangos verifican que j=1 ∑ Rj = k k(k + 1) b 2 El estadístico de contraste se calcula como χ 2 = b (k − 1 )W F que sigue una distribución Chi-Cuadrado con k-1 grados de libertad. se suman dichos rangos. en el caso de empates se consideran los promedios de los órdenes de las observaciones empatadas. Dentro de cada bloque se asignan rangos a la variable respuesta. Para cada nivel j.9500 X 2 20 138. Como toda técnica no paramétrica funciona con rangos en lugar de con los valores originales de la variable respuesta.5000 7.Límite -------------------------------------1 VS 2 -1.180 Variable Bloque: Número de Casos: SEXO 40 con I. obteniéndose Rj. LSD al 95. siendo . con lo que compara varias medianas en lugar de varias medias.

Así. el programa devuelve el siguiente mensaje de error: ERROR : La prueba de Friedman requiere datos balanceados y que solamente haya una única observación para cada posible combinación de la variable explicativa y del bloque. Se detallan en Cuantitativa (y). la Variable explicativa cualitativa y la Variable bloque también cualitativa. diferentes tiempos en un estudio de diseño longitudinal. Opciones: . La hipótesis nula de igualdad de medianas en los grupos se rechaza en el caso en el que pvalor<0. el título del eje X y del eje Y. . Si no es así. que presenta datos longitudinales para cada una de las categorías del factor analizado. en muchas ocasiones. pueden verse los valores de la variable respuesta observados.0  k  2 12 ∑ R 2  − 3b2k (k + 1 ) j    j=1  W = 2 2 3 b k k − 1 − b ∑ empates − empates 181 ( ) empates ( ) Este programa proporciona un p-valor asintótico para esta opción. el mínimo. para cada uno de los niveles del factor. que aparecen en el eje X. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa.Manual G-Stat 2. Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de la variable explicativa o factor. en caso contrario no hay evidencia suficiente para poder rechazarla. Este gráfico permite tener una aproximación visual de cuál es el efecto del factor sobre la variable respuesta respecto de su media y de su dispersión.La cabecera.05. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa. La variable bloque está asociada al sujeto. Para la aplicación de esta técnica es requisito que los datos estén balanceados y que solamente haya una única observación para cada posible combinación de la variable explicativa y del bloque. máximo e incremento del eje Y. El factor puede ser.

182 Cajas: Gráfico de Cajas de la variable respuesta para los distintos valores de la variable explicativa. Los datos son los siguientes: trat 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 resp 9 6 5 11 8 7 9 7 6 12 9 9 7 4 4 19 16 17 Resultados de la estadística descriptiva. : suj 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 Se analizan tres tratamientos en seis sujetos. Se pretende establecer si hay diferencia entre tratamientos. Ver menú Gráficos. Friedman: Resultados de la prueba de Friedman. Anova Friedman. Estadísticos ====================================================================== Variable Respuesta: Variable Explicativa: Variable Bloque: Número de Casos: resp trat sujeto 18 . Se asume que el orden de administración no influye en la respuesta.

1667 8.1818 p-valor: 0.1312 4.Manual G-Stat 2.7329 4.3555 4. Anacova (ax|y) Realiza la prueba del análisis de la covarianza. un segundo al hecho de pertenecer a un grupo u otro SCE y un tercero con origen desconocido residual SCR. El Anacova o Análisis de la Varianza de un factor con covariable se basa en descomponer la variabilidad total SCT en tres componentes: uno que se atribuye a la covariable SCC. las comparaciones múltiples a posteriori.8485 Estadístico de Contraste: 10.0000 16.5000 4.0062 La prueba tiene en cuenta la información del bloque (sujeto). entre otras técnicas asociadas a ella. Friedman ====================================================================== Variable Respuesta: Variable Explicativa: Variable Bloque: Número de Casos: resp trat sujeto 18 Grupos N Rango Medio ----------------------------1 6 3.3333 7.0000 19.6667 3 6 1. .0000 183 Resultados de la prueba de Friedman.0000 4.3333 ----------------------------Coeficiente de Concordancia: 0.2151 7.5000 4.0000 ----------------------------------------------------------------Total | 18 9.0000 2 6 1. Este análisis realizado -erróneamente.0000 3 | 6 8.0000 6.0000 19. facilita.0000 2 | 6 8.0 Desviación Grupos | N Media Mediana Típica Mínimo Máximo ----------------------------------------------------------------1 | 6 11.por Kruskal-Wallis no hubiera detectado diferencias significativas entre tratamientos.5000 4.0000 17. con y sin interacciones.1667 10. Anacova. Asimismo.

con Xc a la matriz de n filas por dos columnas con la primera columna todo de unos y la segunda columna con los valores de la covariable y con X a la matriz de n filas por (1+1+r-1) columnas resultante de añadir (r-1) columnas a la matriz anterior Xc. CME (cuadrado medio entre grupos). de qué grupo o grupos provienen esas diferencias. SCC (suma de cuadrados de la covariable). GLT (grados de libertad total). CME = . El estadístico Fe sigue una distribución F de Snedecor con grados de libertad del numerador GLE y grados de libertad del denominador GLR. SCE (suma de cuadrados entre los grupos). Se tiene que las expresiones para SCT (suma de cuadrados total). GLC (grados de libertad de la covariable). . bc = X t Xc c SCR = (y − Xb ) (y − Xb ) . asociadas a las variables dummy de la variable explicativa con r niveles. CMR (cuadrado medio residual). GLE (grados de libertad entre los grupos). CMC (cuadrado medio de la covariable). En el caso de que se rechace la hipótesis nula de igualdad de medias se puede determinar mediante comparaciones múltiples a posteriori.184 Si se denota por y al vector con los valores de la variable respuesta. en caso contrario no hay evidencia suficiente para poder rechazarla. Fc (estadístico de contraste para la covariable) y Fe (estadístico de contraste para la variable que forma los grupos) son: SCT = y − y y − y ( )( t ) ( ) −1 SCC = SCT − (y − X cb c )t (y − X cb c ) . GLR = GLT − GLC − GLE CMC = SCC SCE SCR .05. SCR (suma de cuadrados residual). GLC = 1 . CMR = GLC GLE GLR Fc = CMC CME . GLE = r − 1 . Fe = CMR CMR El estadístico de contraste Fc sigue una distribución F de Snedecor con grados de libertad del numerador GLC y grados de libertad del denominador GLR. b = X X t Xty c ( ) t −1 X ty SCE = SCT − SCC − SCR GLT = n − 1 . GLR (grados de libertad residual). La hipótesis nula de igualdad de medias se rechaza en el caso en el que Fe tenga un p-valor<0.

Este gráfico permite tener una aproximación visual de cuál es el efecto del factor sobre la variable respuesta respecto de su media y de su dispersión. las medias de la variable cuantitativa. 0. 1. La variable explicativa debe tener dos o más grupos. pueden verse los valores de la variable respuesta observados. errores estándar. si la variable explicativa tiene tres categorías. Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de la variable explicativa o factor.0 Medias e IC 185 Se muestran para cada uno de los grupos.Manual G-Stat 2. media de la covariable). y la última componente es la media de la covariable. intervalos de confianza. intervalos Scheffé. Se detallan en Cuantitativa (y). Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. para la primera categoría el vector l es (1. En la pantalla de opciones se selecciona el método que se desee para el cálculo de los intervalos de las medias. Las fórmulas son análogas a las dadas en Anova / Anova / Medias e IC. aunque el cálculo de los errores estándar viene dado por CMR ⋅ l ⋅ X t X ( ) −1 ⋅ lt . 0. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa. media de la covariable). para la segunda categoría el vector l es (1. intervalos LSD. Existen las siguientes posibilidades: ninguno. intervalos Bonferroni. intervalos HSD. 0. para cada uno de los niveles del factor. 1. junto con su error estándar y sus intervalos de confianza calculados según distintos métodos. donde l es un vector para cada posible media con (1+(r-1)+1) coordenadas. Por ejemplo. . la Variable explicativa cualitativa (factor) y la Covariable cuantitativa. donde la primera componente es uno. las siguientes (r-1) componentes son 1 si es la correspondiente variable dummy y cero en caso contrario. Estadísticos: Estadísticos de la variable respuesta según las categorías de la variable explicativa. Así. 0. Ni la variable respuesta ni la covariable pueden ser constantes. media de la covariable) y para la tercera categoría es (1. que aparecen en el eje X.

Nivel de confianza: Por defecto es 95%. el título del eje X y del eje Y. Opciones: . Cajas: Gráfico de Cajas de la variable respuesta para los distintos valores de la variable explicativa.Método: Ver opción Anova un Factor. Medias e IC: Se muestran para cada uno de los grupos. las medias de la variable respuesta.La cabecera. . pero también son habituales 90% y 99%. el mínimo. máximo e incremento del eje Y. Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. Opciones: . . pero también son habituales 90% y 99%. el título del eje X y del eje Y. Este programa se basa en los resultados de las comparaciones dos a dos obtenidas. El nivel de confianza debe ser >0 y <100. Ver menú Gráficos. El nivel de confianza debe ser >0 y <100. junto con sus intervalos de confianza calculados según distintos métodos.186 Opciones: . las medias de la variable respuesta.Método: Ver opción Anova un Factor. Gráfico de Medias: Se muestran para cada uno de los grupos. Mediante un asterisco se señalan .La cabecera. el mínimo.Nivel de confianza: Por defecto es 95%. máximo e incremento del eje Y. Comparaciones Múltiples: Resultados de las pruebas a posteriori para determinar de qué grupo o grupos provienen las diferencias detectadas en el Anova. . junto con su error estándar y sus intervalos de confianza calculados según distintos métodos. Anova: Resultado del Análisis de la Varianza de un factor con covariable para la comparación de medias de los distintos grupos en presencia de una covariable.

etc. Si la nube de puntos no muestra ninguna pauta o patrón (el rango de oscilación de los residuos no depende del valor de la fila. se tendrá una indicación gráfica de que los residuos son incorrelados: el error cometido para una unidad de estudio no depende de los errores cometidos para las unidades inmediatamente anteriores. Este gráfico sirve para poder detectar falta de homocedasticidad (heterocedasticidad). . Así. Residuos vs Predicciones: Se representan los residuales frente a los valores que predice el modelo. Residuos vs Grupos: Se representan los residuales para cada uno de los grupos. no se observa periodos continuados de residuos crecientes o decrecientes.Nivel de confianza: Por defecto es 95%. Este gráfico sirve para poder detectar falta de homocedasticidad (heterocedasticidad).La cabecera. Opciones: . Opciones: . para cada una de las unidades de estudio del fichero de trabajo (las filas o registros). Los grupos deberían tener dispersiones de los residuos similares. el título del eje X y del eje Y. Residuos vs Registros: Se representan los residuales frente al número de registro en la base de datos.0 187 los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes. Opciones: .Manual G-Stat 2. máximo e incremento del eje Y.La cabecera. el mínimo. pero también son habituales 90% y 99%. . el título del eje X y del eje Y.Método: Ver opción Anova un Factor. el mínimo. La banda de residuos debería ser similar en dispersión y simetría a lo largo de todos los predichos. El nivel de confianza debe ser >0 y <100. máximo e incremento del eje Y. que aparecen en el eje X. se muestra el valor del residuo del modelo estimado. Los residuales se calculan como la diferencia entre el valor observado y el valor que predice el modelo.). Este gráfico no debería mostrar ningún patrón no aleatorio.

0001 Entre Grupos 15.5199 112.0000 2 20 138.7000 137.0000 96.6121 37 123. Anacova. con la variable Farmaco como variable explicativa y FC1 como covariable.0000 13.La cabecera.0000 13.0000 9. FC1 40 Anova ---------------------------------------------------------------------Suma de Cuadrado Cuadrados G. : Aplicar la prueba Anacova a la variable respuesta FC2.2804 112. el mínimo.7858 0.0000 FC1 40 75.9613 1 2310. Anacova ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2 FARMACO.5379 62.8266 1 15. FC1 40 Desviación Grupo N Media Mediana Típica Mínimo Máximo ------------------------------------------------------------------1 20 136.9613 18.0000 158.L.0165 ---------------------------------------------------------------------Total (corr.0000 ------------------------------------------------------------------Total 40 137.4500 137.0000 Anova de la opción Anacova.9500 74.0000 165.) 6878.3435 116. Resultados de la estadística descriptiva. Estadísticos ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2 FARMACO.1287 0. Medio F-valor p-valor -------------------------------------------------------------------------Covariable 2310.7219 Residual 4551. el título del eje X y del eje Y.0000 165.4000 39 .9500 137. máximo e incremento del eje Y.8266 0.188 Opciones: .0000 13.

Anacova.Manual G-Stat 2.4802 133.0709 2. Medias e I. Anacova. Comparaciones Múltiples ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2 FARMACO.4802 134.7756 141. E. FC1 40 189 Tabla de Medias con I.6244 2 20 138.3291 2.7000 Gráficos de Medias con Intervalos errores estándar Comparaciones Múltiples por Bonferroni de la opción Anacova.5174 140. FC1 40 . ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2 FARMACO.C. LSD al 95.0% -------------------------------------------------------------Límite Límite FARMACO N Media E. Inferior Superior -------------------------------------------------------------1 20 137.C.0 Medias e IC de la opción Anacova con los intervalos LSD.8826 -------------------------------------------------------------Total 40 137.

0709 X 2 20 138.Límite -------------------------------------1 VS 2 -1.C.2582 7.1075 -------------------------------------* Diferencia estadísticamente significativa. Bonferroni al 95.190 con I. Residuos vs Predicciones de la opción Anacova.0% ---------------------------------------Grupos FARMACO n Media Homogéneos ---------------------------------------1 20 137.3291 X ---------------------------------------Contraste Diferencia +/. .

las comparaciones múltiples a posteriori. Anova Dos Factores (ab|y) Realiza la prueba de Anova con dos factores con y sin interacción. con Xa a la matriz de n filas por (1+r a-1) columnas con la primera columna todo de unos y las restantes (ra-1) columnas. GLA (grados de libertad de la primera variable . las asociadas a las variables dummy de la primera variable explicativa con ra niveles.0 191 Residuos vs Registros de la opción Anacova. Se denota por y al vector con los valores de la variable respuesta. con X a la matriz de n filas por (1+r a-1+r b-1) columnas resultantes de añadir (rb-1) columnas a la matriz anterior Xa. SCA (suma de cuadrados de la primera variable explicativa). No se observan tendencias. El Análisis de la Varianza de dos factores se basa en descomponer la variabilidad total SCT en tres componentes: uno para un factor SCA. Asimismo. entre otras técnicas asociadas a ella. Se tiene que las expresiones para SCT (suma de cuadrados total). un segundo para el otro factor SCB y un tercero con origen desconocido SCR. GLT (grados de libertad total). asociadas a las variables dummy de la segunda variable explicativa con rb niveles. facilita.Manual G-Stat 2. patrones. ni variaciones en la dispersión de los residuos. SCR (suma de cuadrados residual). SCB (suma de cuadrados de la segunda variable explicativa.

Fb = CMR CMR El estadístico de contraste Fa sigue una distribución F de Snedecor con grados de libertad del numerador GLA y grados de libertad del denominador GLR. Se incluye también la posibilidad de contemplar la interacción entre los dos factores. CMR = GLA GLB GLR Fa = CMA CMB . En el caso de que se rechace la hipótesis nula de igualdad de medias se puede determinar mediante comparaciones múltiples a posteriori. Fa (estadístico de contraste para la primera variable explicativa) y Fb (estadístico de contraste para la segunda variable explicativa) son: SCT = y − y y − y ( )( t ) ( ) −1 SCA = SCT − (y − X ab a )t (y − X ab a ) . GLB (grados de libertad de la segunda variable explicativa). la hipótesis nula de igualdad de medias se rechaza en el caso en el que su F tenga un p-valor<0. b = X X t Xty a ( ) t −1 Xty SCB = SCT − SCA − SCR GLT = n − 1 . Medias e IC Se muestran para cada uno de los grupos. Si su F tiene un p-valor<0.05. El estadístico Fb sigue una distribución F de Snedecor con grados de libertad del numerador GLB y grados de libertad del denominador GLR. CMB = . en caso contrario no hay evidencia suficiente para poder rechazarla. La hipótesis nula del factor de interacción está relacionada con la ausencia de interacción. GLB = rb − 1 . Para cada factor. GLR (grados de libertad residual). junto con su error estándar y sus intervalos de confianza calculados según distintos métodos. . CMR (cuadrado medio residual). GLR = GLT − GLA − GLB CMA = SCA SCB SCR . CMB (cuadrado medio de la segunda variable explicativa). Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”.192 explicativa). las medias de la variable cuantitativa.05 se rechaza la ausencia de interacción. b a = X t X a a SCR = (y − Xb ) (y − Xb ) . de qué grupo o grupos provienen esas diferencias. GLA = ra − 1 . CMA (cuadrado medio de la primera variable explicativa). que a efectos computacionales es como un nuevo factor que se crea a partir de la combinación de los niveles de los dos factores.

las componentes relativas a cada variable explicativa es 1 en la correspondiente variable dummy y cero en caso contrario. 1) y para la segunda categoría de la segunda variable explicativa el vector l es (1. para la primera categoría de la primera variable explicativa el vector l es (1. 1. Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de cada variable explicativa o factor. Así. intervalos HSD. para la tercera categoría de la primera variable explicativa es (1.0 193 En la pantalla de opciones se selecciona el método que se desee para el cálculo de los intervalos de las medias. Las fórmulas son análogas a las dadas en Anova / Anova / Medias e IC. La variable respuesta no puede ser constante. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y las dos Variables explicativas cualitativas que forman los grupos. 0. Por ejemplo. 0. y las componentes relativas a la otra variable explicativa es el inverso del número de categorías de dicha variable explicativa. 1/3. si la primera variable explicativa tiene tres categorías y la segunda variable explicativa tiene dos categorías. 1/3.Manual G-Stat 2. errores estándar. Estadísticos: Estadísticos de la variable respuesta para cada categoría de las variables explicativas y sus combinaciones. 1/2). para la segunda categoría de la primera variable explicativa el vector l es (1. Se detallan en Cuantitativa (y). donde l es un vector para cada posible media con (1+(ra-1)+(rb -1)) coordenadas. 0. intervalos de confianza. aunque el cálculo de los errores estándar viene dado por CMR ⋅ l ⋅ X t X ( ) −1 ⋅ lt . 1. 1/2). 1/3. 0. intervalos LSD. intervalos Bonferroni. que aparecen en el eje X. Las variables explicativas deben tener dos o más grupos. donde la primera componente es uno. 1/2). para cada uno de los niveles del factor. Existen las siguientes posibilidades: ninguno. 0). Este gráfico permite tener una aproximación visual de cuál es el efecto del . para la primera categoría de la segunda variable explicativa el vector l es (1. intervalos Scheffé. pueden verse los valores de la variable respuesta observados. 1/3.

las medias de la variable respuesta.La cabecera. .La cabecera.Incluir o no el término interacción en el modelo. El nivel de confianza debe ser >0 y <100. Anova: Resultados del Análisis de la Varianza de dos factores para la comparación de medias de los distintos grupos. Opciones: . . junto con sus intervalos de confianza calculados según distintos métodos. el mínimo. el título del eje X y del eje Y.194 factor sobre la variable respuesta respecto de su media y de su dispersión. Medias e IC: En esta tabla se muestran para cada uno de los grupos de los dos factores. máximo e incremento del eje Y.Método: Ver opción Anova un Factor. Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. Opciones: . .Nivel de confianza: Por defecto es 95%.Método: Ver opción Anova un Factor. las medias de la variable respuesta. . pero también son habituales 90% y 99%. Opciones: . el mínimo. Gráfico de Medias: Se muestran para cada uno de los grupos de los dos factores. máximo e incremento del eje Y. el título del eje X y del eje Y.Incluir o no el término interacción en el modelo. . Opciones: .Nivel de confianza: Por defecto es 95%. junto con su error estándar y sus intervalos de confianza calculados según distintos métodos.Incluir o no el término interacción en el modelo. pero también son habituales 90% y 99%. El nivel de confianza debe ser >0 y <100. .

0000 2 11 68. Resultados descriptivos.0000 74. Estadísticos ====================================================================== Variable Respuesta: FC2FC1 Variable(s) Explicativa(s): STATUS.Incluir o no el término interacción en el modelo. Anova Dos Factores. El nivel de confianza entre >0 y <100.1667 53. Opciones: .0 195 Comparaciones Múltiples: Resultados de las pruebas a posteriori para determinar de qué grupo o grupos de los dos factores provienen las diferencias detectadas en el Anova. puede ser el resultado de la variabilidad de la variable respuesta.0000 -------------------------------------------------------------------Total 40 61.0000 82. lo que se conoce como interacción.0000 10. Gráfico Interacciones: El objetivo de este gráfico es detectar la posible interacción entre los factores. La propia combinación de los efectos de cada uno de los factores que forman parte del estudio. pero también son habituales 90% y 99%.1183 42. Este programa se basa en los resultados de las comparaciones dos a dos obtenidas. FARMACO Número de Casos: 40 Desviación STATUS N Media Mediana Típica Mínimo Máximo -------------------------------------------------------------------3 12 56.0000 1 17 61.Método: Ver opción Anova un Factor.7500 61. . que se presenta en el caso de que en el gráfico no haya paralelismo entre las rectas.4545 69. Gráficamente la interacción de factores se refleja mediante la ausencia de paralelismo de las rectas que unen las medias. .5644 42.0000 82.3529 59.Manual G-Stat 2. En caso de que haya interacción.9772 42. Mediante un asterisco se señalan los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes.0000 10.0000 .Nivel de confianza: Por defecto es 95%.0000 11. la interpretación de la influencia de los factores no es directa.0000 82.8913 60.0000 7. : Aplicar la prueba del Anova dos factores para analizar la variable FC2FC1 como variable respuesta empleando las variables Farmaco y Status como variables explicativas.

Medio F-valor p-valor ---------------------------------------------------------------------STATUS 871.8074 44.0000 76.0000 82.196 Desviación FARMACO N Media Mediana Típica Mínimo Máximo -------------------------------------------------------------------2 20 62.0000 ---------------------------------------------------------------------STATUS Desviación FARMACO N Media Mediana Típica Mínimo Máximo --------------------------------------------------------------------2.7500 61.0000 1 20 61.0000 1.9772 42.0000 --------------------------------------------------------------------Total 40 61.0000 82.1657 1 7.2237 2 435.0000 10.0000 78.0889 34 110.) 4699.0000 10.0108 0. Anova Dos Factores ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2FC1 STATUS.L.0000 3.0651 0.9772 42.5000 12.0000 3.4000 70.4108 42.7651 48.0000 12.1 6 54.0000 78.1657 0.0000 --------------------------------------------------------------------- Resultados del Anova con interacción.0000 10.5000 7.5000 39 .0000 74.3333 52.0000 58.5556 59.0000 2.6119 3.1500 59.0000 82.2 6 66.6206 44.0320 ---------------------------------------------------------------------Total (corr.0217 2 40.8333 65.8001 STATUS*FARMACO 80.0000 82.1 5 70.9590 0.6978 Residual 3741.3500 62.0000 8.8769 60.2 8 62.2500 62.0000 9. FARMACO 40 Anova ---------------------------------------------------------------------Suma de Cuadrado Cuadrados G.3636 0.0000 74.2 6 58.0285 FARMACO 7.3869 60.1 9 60.9848 42.0000 10.0000 ---------------------------------------------------------------------Total 40 61.7500 61.7388 42.0000 9.0000 1.0000 82.

1407 20 20 61.5259 59.8773 65.7251 Gráfico de medias con Intervalos errores estándar para el factor Status.9868 STATUS 1 2 3 FARMACO 1 2 17 11 12 61.2241 60.4160 56.5006 3.3387 2.C.1667 2.3142 59.9741 58. ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2FC1 STATUS.8785 71. .0 Medias e IC con los errores estándar de los subgrupos sin interacción.4109 2.5628 62.Manual G-Stat 2. FARMACO 40 197 Tabla de Medias con Intervalos Errores Estándar ---------------------------------------------------------Límite Límite n Media E.1926 63. Inferior Superior ---------------------------------------------------------Total 40 61. Medias e I. Anova Dos Factores.0967 63.9015 64.1099 2.3061 53.E.3779 68.

. FC2FC1 STATUS. Comparaciones Múltiples ===================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: Modelo con Interacción con I.2139 10.C.4500 *11.1667 X 1 17 61.6167 X -------------------------------------Contraste Diferencia +/. FARMACO 40 Gráfico de medias con indicación de las interacciones.4229 1 VS 3 5. Scheffé al 95.Límite -------------------------------------1 VS 2 -7.198 Comparaciones múltiples con la prueba de Scheffé en un modelo con interacción.0% -------------------------------------Grupos STATUS n Media Homogéneos -------------------------------------3 12 56.2320 -------------------------------------* Diferencia estadísticamente significativa.4028 XX 2 11 68. Anova Dos Factores.2361 10.1306 2 VS 3 *12.

CMR (cuadrado medio residual). Se denota por y al vector con los valores de la variable respuesta. GLC (grados de libertad de la tercera variable explicativa). las comparaciones múltiples a posteriori. ba = XaX a Xt y a SCB = SCT − SCA − (y − X abb ab )t (y − Xabbab ) . SCR (suma de cuadrados residual). Se tiene que las expresiones para SCT (suma de cuadrados total). SCA (suma de cuadrados de la primera variable explicativa). GLA (grados de libertad de la primera variable explicativa). El Análisis de la Varianza Factorial (tres factores) se basa en descomponer la variabilidad total SCT en cuatro componentes: para el primer factor SCA. con Xab a la matriz de n filas por (1+r a-1+r b-1) columnas resultante de añadir (rb-1) columnas a la matriz anterior Xa. bab = X t X ab ab SCR = (y − Xb ) (y − Xb ) .0 199 Anova Factorial (abc|y) Realiza la prueba Anova factorial para tres factores con y sin interacciones dobles y triples. SCC (suma de cuadrados de la tercera variable explicativa). con Xa a la matriz de n filas por (1+r a-1) columnas con la primera columna todo de unos y las restantes (ra-1) columnas. asociadas a las variables dummy de la tercera variable explicativa con rc niveles. CMB (cuadrado medio de la segunda variable explicativa). GLR (grados de libertad residual). Asimismo. b = X X t ( ) −1 Xt y ab ( ) t −1 X ty . CMC (cuadrado medio de la tercera variable explicativa). para el segundo factor SCB. con X a la matriz de n filas por (1+r a-1+r b-1+r c-1) columnas resultante de añadir (rc-1) columnas a la matriz anterior Xab. Fa (estadístico de contraste para la primera variable explicativa). asociadas a las variables dummy de la segunda variable explicativa con rb niveles. facilita. GLT (grados de libertad total). para el tercer factor SCC y un cuarto con origen desconocido SCR. CMA (cuadrado medio de la primera variable explicativa).Manual G-Stat 2. GLB (grados de libertad de la segunda variable explicativa). SCB (suma de cuadrados de la segunda variable explicativa). entre otras técnicas asociadas a ella. las asociadas a las variables dummy de la primera variable explicativa con ra niveles. Fb (estadístico de contraste para la segunda variable explicativa) y F (estadístico de contraste para la tercera variable c explicativa) son: SCT = y − y y − y ( )( t ) ( ) −1 t SCA = SCT − (y − X ab a )t (y − Xab a ) .

GLA CMB = SCB . la hipótesis nula de igualdad de medias se rechaza en el caso en el que su F tenga un pvalor<0. en caso contrario no hay evidencia suficiente para poder rechazarla. de qué grupo o grupos provienen esas diferencias.200 SCC = SCT − SCA − SCB − SCR GLT = n − 1 . Se incluye también la posibilidad de contemplar las interacciones entre dos factores o incluso entre los tres factores. Fc = CMR CMR CMR El estadístico de contraste Fa sigue una distribución F de Snedecor con grados de libertad del numerador GLA y grados de libertad del denominador GLR. Fb = . las medias de la variable cuantitativa. GLC CMR = SCR GLR Fa = CMA CMB CMC . aunque el cálculo de los errores estándar viene dado por CMR ⋅ l ⋅ Xt X ( ) −1 ⋅ lt . El estadístico Fb sigue una distribución F de Snedecor con grados de libertad del numerador GLB y grados de libertad del denominador GLR. intervalos HSD. El estadístico F c sigue una distribución F de Snedecor con grados de libertad del numerador GLC y grados de libertad del denominador GLR. GLB CMC = SCC .05. Existen las siguientes posibilidades: ninguno. intervalos LSD. intervalos de confianza. Las fórmulas son análogas a las dadas en Anova / Anova / Medias e IC. intervalos Bonferroni. Medias e IC En la tabla correspondiente se muestran para cada uno de los grupos. que a efectos computacionales son como un nuevo factor que se crea a partir de la combinación de los niveles de los dos o tres factores. errores estándar. GLC = rc − 1 GLR = GLT − GLA − GLB − GLC CMA = SCA . Para cada factor. GLA = ra − 1 . GLB = rb − 1 . Estos intervalos confidenciales se pueden representar gráficamente con la pestaña “Gráfico de Medias”. En el caso de que se rechace la hipótesis nula de igualdad de medias se puede determinar mediante comparaciones múltiples a posteriori. En la pantalla de opciones se selecciona el método que se desee para el cálculo de los intervalos de las medias. intervalos Scheffé. junto con su error estándar y sus intervalos confidenciales calculados según distintos métodos.

para la primera categoría de la primera variable explicativa el vector l es (1. 1/2.0 201 donde l es un vector para cada posible media con (1+(ra-1)+(rb -1)+(rc -1)) coordenadas. 0. Este gráfico permite tener una aproximación visual de cuál es el efecto del factor sobre la variable respuesta respecto de su media y de su dispersión. Así. Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y las tres Variables explicativas cualitativas que forman los grupos. 1/2. para la segunda categoría de la primera variable explicativa el vector l es (1. pueden verse los valores de la variable respuesta observados. si la primera variable explicativa tiene tres categorías. 0. 1/3. 1/2). 1/2). las componentes relativas a cada variable explicativa es 1 en la correspondiente variable dummy y cero en caso contrario. 1/2). Dispersión: Se muestran los datos de los casos para la variable respuesta según las categorías de cada variable explicativa o factor. para cada uno de los niveles del factor. Se detallan en Cuantitativa (y). para la segunda categoría de la segunda variable explicativa el vector l es (1. 1. 1. donde la primera componente es uno. para la primera categoría de la tercera variable explicativa el vector l es (1.Manual G-Stat 2. 1/3. Por ejemplo. 0). el título del eje X y del eje Y. que aparecen en el eje X. 1/2.La cabecera. 1) y para la segunda categoría de la tercera variable explicativa el vector l es (1. 0. 0. para la primera categoría de la segunda variable explicativa el vector l es (1. 1. 1/3. la segunda variable explicativa tiene dos categorías y la tercera variable explicativa tiene dos categorías. La variable respuesta no puede ser constante. y las componentes relativas a las otras variables explicativas son el inverso del número de categorías de la correspondiente variable explicativa. Estadísticos: Estadísticos de la variable respuesta para cada categoría de las variables explicativas y sus combinaciones. Opciones: . 0. 1/3. 1/3. 1/2. 1/3. máximo e incremento del eje Y. 1/2). 1/3. Las variables explicativas deben tener dos o más grupos. para la tercera categoría de la primera variable explicativa es (1. 1/2. 1/2). el mínimo. 1/3. .

Opciones: .Nivel de confianza: Por defecto es 95%.202 Anova: Resultados del Análisis de la Varianza de dos factores para la comparación de medias de los distintos grupos. las medias de la variable respuesta. también se incluirán las dobles. Gráfico de Medias: Se muestran para cada uno de los grupos de los tres factores. El nivel de confianza debe ser >0 y <100. Medias e IC: En esta tabla se muestran para cada uno de los grupos de los tres factores . junto con su error estándar y sus intervalos de confianza calculados según distintos métodos. .Método: Ver opción Anova un Factor. junto con sus intervalos de confianza calculados según distintos métodos. las medias de la variable respuesta. también se incluirán las dobles. pero también son habituales 90% y 99%. Opciones de Anova en Anova Factorial.Incluir o no los términos de interacción doble o triple en el modelo.Incluir o no los términos de interacción doble o triple en el modelo. Estos intervalos de confianza se pueden representar gráficamente con la pestaña “Gráfico de Medias”. . Si se señala el análisis de la interacción triple. Si se señala el análisis de la interacción triple. Opciones: . .

203 . máximo e incremento del eje Y. El nivel de confianza debe ser >0 y <100. Mediante un asterisco se señalan los grupos que son diferentes y mediante un aspa se agrupan los grupos homogéneos o semejantes.Manual G-Stat 2. Gráficamente la interacción de factores se refleja mediante la ausencia de paralelismo de las rectas que unen las medias. pero también son habituales 90% y 99%.Nivel de confianza: Por defecto es 95%. Opciones: . la interpretación de la influencia de los factores no es directa.Nivel de confianza: Por defecto es 95%. Gráfico Interacciones: El objetivo de este gráfico es detectar la posible interacción entre los factores. En caso de que haya interacción. .Incluir o no los términos de interacción doble o triple en el modelo. Si se señala el análisis de la interacción triple. El nivel de confianza debe ser >0 y <100. que se presenta en el caso de que en el gráfico no haya paralelismo entre las rectas.Incluir o no los términos de interacción doble o triple en el modelo. . pero también son habituales 90% y 99%. el título del eje X y del eje Y. lo que se conoce como interacción. también se incluirán las dobles. La propia combinación de los efectos de cada uno de los factores que forman parte del estudio. puede ser el resultado de la variabilidad de la variable respuesta. también se incluirán las dobles.0 Opciones: .Método: Ver opción Anova un Factor. Comparaciones Múltiples: Resultados de las pruebas a posteriori para determinar de qué grupo o grupos de los tres factores provienen las diferencias detectadas en el Anova. . Este programa se basa en los resultados de las comparaciones dos a dos obtenidas. .La cabecera.Método: Ver opción Anova un Factor. . Si se señala el análisis de la interacción triple. el mínimo.

FC2FC1 FARMACO.0000 82.0000 74.8000 69.0000 67. .0000 76.0000 2. .7778 58.0000 74.3333 65. .6040 46.0000 11.3751 42.9772 42.2 6 67.0000 12.0000 10. Estadísticos ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: .204 : Realizar la prueba Anova Factorial de la variable FC2FC1 con Farmaco.0000 82.7500 61.0000 1. Variables en la opción Anova Factorial.4538 60. .2 5 69. STATUS 40 FUMADOR Desviación STATUS N Media Mediana Típica Mínimo Máximo ---------------------------------------------------------------------2.0000 10.1 8 62.3333 58. Estadísticos de la opción Anova Factorial (sólo se muestran una interacción doble y la triple).0000 1. Anova Factorial. .0000 10.3 3 61.8867 62.0000 7. .0000 2. .0000 82.0000 ---------------------------------------------------------------------Total 40 61. .0000 ---------------------------------------------------------------------- .3816 42.4444 52.3 9 54.0000 8.0000 78. FUMADOR.1 9 60. Fumador y Status como variables explicativas.0000 1.3725 52.

1 4 65.0000 72.2.0000 82.7500 61.2.8282 A*C 120.5000 58.4190 1 5.0000 74. STATUS 40 Anova -------------------------------------------------------------------Suma de Cuadrado Cuadrados G.0000 1.5000 39 .8000 59.1316 62.0000 68.0000 1.0829 60.3866 46.2.1.0000 ---------------------------------------------------------------------Total 40 61.0000 2.4568 1.L.1 5 61.0000 12.2 2 73.3 3 47.0519 -------------------------------------------------------------------Total (corr.Manual G-Stat 2.0000 12.0000 1.0000 73.4568 1 187.4000 0.0000 2.0000 2.2.0682 2 382.6667 70.0000 76.0000 5.5498 52.0554 48.3793 0.0000 10.0000 58.0000 70.2.0000 10.2 3 66.4000 1 14.0332 42.1 4 59.0000 82.0000 5.0000 1.0479 0.0000 76. Anova Factorial ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2FC1 FARMACO.) 4699.1 4 59.3955 Residual 3391. Medio F-valor p-valor -------------------------------------------------------------------FARMACO 14.0000 13.6667 69.9570 0.3 6 58.5317 0.2221 2 60.9772 42.3333 58.0000 10.2 3 67.0000 74.0000 1.0000 13.3 3 61.5556 30 113.1274 0.0000 61.0 205 FARMACO FUMADOR Desviación STATUS N Media Mediana Típica Mínimo Máximo ---------------------------------------------------------------------2. FUMADOR.0000 ---------------------------------------------------------------------- Tabla del Anova Factorial con interacciones dobles.0000 7.7237 FUMADOR 187.0000 78.7279 64.2077 STATUS 764.8074 44.0341 3.0000 2.3333 48.1110 0.0000 82.3923 60.1891 0.2.1.0000 8.3725 52.6581 0.0000 60.0000 11.7113 42.1.2 3 68.4190 0.1.1.0000 1.0000 52.3783 2 108.0000 72.0475 INTERACCIONES A*B 5.5930 B*C 216.

C.9683 13. .206 Comparaciones múltiples por Bonferroni de la opción Anova factorial con interacciones dobles para la variable Status. STATUS 40 Modelo con interacciones 2 niveles con I.Límite -------------------------------------1 VS 2 -7. Anova Factorial.0% -------------------------------------Grupos STATUS n Media Homogéneos -------------------------------------3 12 60.6786 X 1 17 61.6468 X -------------------------------------Contraste Diferencia +/.2659 10.5089 1 VS 3 0.7024 12. Interacciones de la opción Anova factorial para Farmaco por Status. Bonferroni al 95.3810 X 2 11 68.8128 -------------------------------------* Diferencia estadísticamente significativa.7744 2 VS 3 7. FUMADOR. Comparaciones Múltiples ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2FC1 FARMACO.

En Regresión Logística se tiene que varias variables explicativas cuantitativas (xz) intentan explicar una variable respuesta dicotómica o binaria (b). En Regresión Múltiple se tiene que varias variables explicativas cuantitativas (xz) intentan explicar una variable respuesta cuantitativa (y). inclusive las de naturaleza dicotómica. Este menú contiene las opciones necesarias para realizar distintas regresiones multivariantes. En Regresión de Cox se tiene que varias variables explicativas cuantitativas (xz) intentan explicar una variable respuesta censurada (y cens). Para el estudio de las interacciones entre variables explicativas hay que crear previamente las variables de interacción como producto aritmético de dichas . es necesario generar previamente k-1 variables ficticias y asignarles los códigos binarios correspondientes.Manual G-Stat 2. La forma de proceder es la siguiente: insertar k-1 variables con sus nombres correspondientes.0 207 Menú Multivariante Activar la opción Multivariante del menú principal o mediante Alt+M. La forma de generación de k-1 variables ficticias a partir de una variable cualitativa con k categorías es la siguiente: Variable Cualitativa Categoría 1 Categoría 2 Categoría 3 … Categoría k Ficticia 1 0 1 0 … 0 Ficticia 2 0 0 1 … 0 … … … … … … Ficticia k-1 0 0 0 … 1 Este paso no es automático en G-Stat. Todas las variables explicativas han de ser numéricas. En las tres regresiones si se desea utilizar variables explicativas cualitativas de k categorías. copiar (mediante CTRL+C y CTRL+V) k-1 veces la variable cualitativa que se quiere transformar en “dummy” en las variables insertadas y recodificar dichas variables según el esquema de la tabla anterior.

Regresión Múltiple (xz|y) Realiza la regresión lineal múltiple que modeliza una variable respuesta cuantitativa a partir de varias variables explicativas cuantitativas. X es una matriz de dimensiones n por (1+r) con la primera columna igual a uno. El vector de parámetros β se estima por el vector de coeficientes b a través del método de mínimos cuadrados b = XtX ( ) −1 Xty A partir del modelo se calculan los valores predichos mediante ˆ y = Xb por lo que los residuos estimados son ˆ e = ˆ = y − y = y − Xb ε Mediante el vector de residuos estimados se calcula la desviación típica estimada de los residuos s con s= ˆtˆ εε n − (r + 1) El vector de errores estándar de los coeficientes b se estima a través de la raíz cuadrada de los elementos de la diagonal principal de la matriz Cov(b) de varianzas-covarianzas de b dada por Cov(b) = s2 X t X ( ) −1 . El modelo que se asume para describir la relación entre el conjunto de r variables explicativas y la variable respuesta y es y = Xβ + ε donde y es un vector de dimensiones n por 1.208 variables mediante el menú de Utilidades / Transformación. β es el vector de parámetros del modelo de dimensiones (r+1) por 1 y ε es el vector de residuos de dimensiones n por 1. Posteriormente se tratan como una variable explicativa más.

GLM (grados de libertad del modelo). El coeficiente R2 de determinación suministra el porcentaje de información de la variable respuesta explicado por el modelo mediante R2 = SCM SCT Un ajuste de R2 teniendo en cuenta el número de variables.Manual G-Stat 2. GLM = r .0 209 La significación de cada variable se lee en cada uno de los p-valores asociados a cada coeficiente. SCR (suma de cuadrados residual). CMM (cuadrado medio del modelo). CMR = GLM GLR F= CMM CMR que sigue una distribución F de Snedecor con grados de libertad del numerador GLM y grados de libertad del denominador GLR. es R 2 ajustado= 1 − 1 − R 2 ( GLT ) GLR El coeficiente de variación se calcula mediante la expresión 100 ⋅ s y La detección de correlación en los residuales la da el estadístico de DurbinWatson mediante la expresión . La tabla del Anova muestra mediante la F del Modelo si el modelo ajusta a los datos. y se calcula a través del estadístico t que resulta de dividir el coeficiente entre su error estándar. CMR (cuadrado medio residual). que se calculan de la forma siguiente: SCT = yt y − ny 2 ˆt ˆ ˆ SCM = y y − ny 2 SCR = ˆtˆ = SCT − SCM εε GLT = n − 1 . GLR (grados de libertad de los residuos). ya que a mayor número de variables se corresponde mayor R2. F del modelo y p del modelo. GLT (grados de libertad total). SCM (suma de cuadrados del modelo). GLR = n − (r + 1) = GLT − GLM CMM = SCM SCR . En dicha tabla intervienen SCT (suma de cuadrados total).

Los residuos vienen dados por e.210 ε ε ∑ ˆj − ˆj−1 j =1 n j= 2 ( )2 ε ∑ˆj n 2 Coeficientes e IC Para cada coeficiente b j del vector b se calcula su intervalo confidencial como b j ± t1− α / 2. la multicolinealidad se da cuando las correlaciones entre variables independientes son elevadas. Por tanto. Predicciones Se muestran los residuos. lo cual no es conveniente porque la estimación del modelo puede no ser posible. con ˆ e = ˆ = y − y = y − Xb ε Los residuos estudentizados calculan los residuos “jacknife” r(-i) mediante r(− i) = s2−i) ⋅ (1 − hi ) ( ei donde s (-i) es la desviación típica estimada de los residuos cuando se suprime la observación del individuo i y h i es el elemento i de la diagonal de la matriz H de dimensiones n por n dada por H = X XtX ( ) −1 Xt La matriz H recibe el nombre de “hat matrix” ya que ˆ y = Hy . los residuos estudentizados y las predicciones. n− (r +1) ⋅ EE b j [ ] El coeficiente Factor Incremento de la Varianza FIV (“Variance Inflation Factor” = VIF) permite detectar la presencia de multicolinealidad y se calcula como VIFj = 1 1 − R2 j siendo R 2 el coeficiente de determinación múltiple en una regresión con j variable respuesta la variable xj y variables explicativas el resto de variables x.

Opciones: .Manual G-Stat 2. Correlaciones: Se muestran los coeficientes de correlación de Pearson y de Spearman para cada par de variables. Estadísticos: Estadísticos de todas las variables seleccionadas. Las variables no deben tener varianza cero.Si se quiere incluir o no el término constante. n− (r +1) ⋅ s hi i Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa y la(s) Variable(s) explicativa(s) cuantitativas. el coeficiente R2 y el estadístico de Durbin-Watson. la tabla del Anova.Selección de variables: incluir todas.Nivel de significación p para entrar y para salir en el proceso secuencial de selección del modelo: las variables van entrando en el modelo si realmente lo mejoran más allá de lo que podría deberse al azar (p-para-entrar) y pueden salir si no mejoran el modelo significativamente (con relación a p-para-salir). n−( r +1) ⋅ s i 1 + hi npred siendo npred el número usado para las predicciones. Se detallan en Cuantitativa (y). aplicar un procedimiento paso a paso hacia adelante o hacia detrás. Para las predicciones de valores medios se utiliza Pred ± t1− α / 2. La significación dada por el p-valor (entre paréntesis) está contrastando la hipótesis nula de que el coeficiente de correlación poblacional es cero. entre otros.0 211 Los residuos “jacknife” pueden requerir elevados recursos computacionales para ficheros de más de 1000 casos. . . . Modelo: Se muestra la ecuación del modelo. Sólo se tienen en cuenta los registros completos para todas las variables analizadas. Para las predicciones de valores individuales se utiliza Pred ± t1 −α / 2.

Por defecto. En opciones se debe redefinir el modelo tal y como se definió en la pestaña Modelo.Nivel de confianza: Por defecto es 95%. El nivel de confianza debe ser >0 y <100.1 y el número máximo de iteraciones es 20. En las opciones el valor por defecto es 95%. El nivel de confianza se puede modificar en la ventana de opciones. incluidas todas las variables.Número máximo de iteraciones que se permite. El nivel de confianza debe ser >0 y <100. pero también son habituales 90% y 99%. su intervalo de confianza y su coeficiente Factor Incremento de la Varianza (FIV). Coeficientes e IC: Se muestran para cada coeficiente de la regresión múltiple su error estándar. no se asegura la convergencia en todos los casos. . Predicciones: Se presentan predicciones e intervalos de confianza partir de las variables explicativas.212 . Aunque el algoritmo utilizado es robusto en la mayoría de situaciones. el programa tiene marcadas las opciones: incluido el término constante. En opciones se debe redefinir el modelo tal y como se definió en la pestaña Modelo. . Las ventanas de opciones no están conectadas entre ventanas. por lo que cualquier cambio en una pestaña debe realizarse nuevamente en las demás si se desean resultados coherentes. p-paraentrar y p-para-salir con valor 0.

E. t-valor p-valor --------------------------------------------------------CONSTANTE 222.9393 -0. Resultados de la matriz de correlaciones de Pearson y su significación.0001E-18 EDAD -7.9158 --------------------------------------------------------- .1198 10.2537) ---------------------------------------------------------------------- FC1 Resultados del modelo.2537) -0.1887 21. Modelo ====================================================================== Variable Respuesta: FC2FC1 Variable(s) Explicativa(s): EDAD.0070 0.0001) 1.1676 0.0000 0. FC1 40 r de Pearson (Significación) FC2FC1 EDAD FC1 --------------------------------------------FC2FC1 1. Regresión Múltiple.0002E-14 FC1 0.4382 -16.3821 0.0001) (0. Correlaciones ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2FC1 EDAD.0000 -0.0000 (0.1848 (0.3012) EDAD -0.0 213 : Se desea modelizar mediante regresión lineal múltiple la variable FC2FC1 en función de las variables Edad y FC1.0661 0.8005 0.1848 1. E.1064 0.3012) (0.1784 0. incluyendo todas las variables. FC1 Número de Casos: 40 --------------------------------------------------------Coef.Manual G-Stat 2. Regresión Lineal Múltiple.9393 (0.1676 (0. con la significación de los coeficientes.

1409 1.0353 FC1 0.E.214 Anova --------------------------------------------------------------Suma de Cuadrado Variabilidad Cuadrados G. Inferior Superior Varianza (FIV) ---------------------------------------------------------------------CONSTANTE 222.2242 % 87.) 4699.9014 1.00% ---------------------------------------------------------------------Factor Límite Límite Incremento Coef.5876 % 3.4756 242.5536 Intervalos de confianza de los coeficientes y valores FIV.2630 % 2.4048 37 14.0662 -6. Coeficientes e I. FC1 40 Coeficientes e I.8674 6.0661 -0.0070 0.4382 -8. ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FC2FC1 EDAD. E.0952 2 2073.1198 10. Predicciones ====================================================================== Variable Respuesta: FC2FC1 Variable(s) Explicativa(s): EDAD.0353 ---------------------------------------------------------------------- Estimados y análisis de residuales de algunos casos.0007E-14 Residual 553.2906 1.5000 39 r cuadrado (coficiente de determinación) r cuadrado (ajustado) Desviación Típica de los Residuos Coeficiente de variación Error Absoluto Medio Durbin-Watson 88.L.1784 0.6015 0.) 4699. Medio F-valor p-valor -------------------------------------------------------------------Modelo 4146.1268 0.5000 39 -------------------------------------------------------------------Total (corr.0476 138. Regresión Lineal Múltiple.7640 EDAD -7.C. Regresión Lineal Múltiple.1887 201. al 95. FC1 Número de Casos: 40 .9569 -------------------------------------------------------------------Total (corr.C.

.0000 79. 1 + exp − b 0 + b1x1 + . disminuyendo en cada iteración el “–2Log Likelihood”. hasta alcanzar su valor mínimo en el modelo final. Conviene codificar la variable respuesta Y con unos y ceros.Manual G-Stat 2.0 ---------------------------------------------------------------------Valor Valor Límite Conf.9412 2. 215 Regresión Logística (xz|b) Realiza la regresión logística que modeliza una variable respuesta dicotómica o binaria (relacionada con la ocurrencia de un suceso) a partir de varias variables explicativas cuantitativas.5629 -1. . + bp xp ( ( )) donde bj está asociado a la variable explicativa j-ésima y b0 es un coeficiente que no está asignado a ninguna variable. también facilita sus errores estándar. xp es el siguiente: Prob(yi = 1) = 1 .1002 -3. Límite Conf.7439 68. El modelo de regresión logística para p variables explicativas x1. x2. Este método además de proporcionar los coeficientes del modelo. también llamado constante o “intercepta”.6549 71.8115 44. Observado Predicho Residuo Inferior 95.00 ---------------------------------------------------------------------59. El procedimiento de maximización se realiza por el método iterativo de Newton-Raphson.7755 59.0000 68.0620 66.2488 .0000 67.0000 60.6013 49..0217 66.1653 69.6299 63. El coeficiente de correlación parcial R se calcula como . .2211 46.5629 57.5655 81.3993 66. A partir de los coeficientes bi y de los errores estándar EE(b i) se construye el estadístico de contraste de Wald con  bj   Waldj =   EE(b j)    2 que sigue una Chi-Cuadrado con 1 grado de libertad.00 Superior 95.0000 61.0588 62.2245 6.4960 76. .0000 46. . ….2003 63.1002 76.0000 63.1386 65.9380 1. Estos coeficientes se determinan maximizando la función de verosimilitud de la muestra.0362 70.6007 4. de forma que el código uno se asocie al suceso de interés.8115 -0.6350 72.

216
Waldj − 2 − 2LL(0)

R=

donde –2LL(0) es menos dos veces el logaritmo neperiano de la función de verosimilitud en el paso inicial (paso cero). El signo de R es el signo del coeficiente. Si Wald es menor que dos, se considera R igual a cero. El contraste de ajuste del modelo (Diferencia de Likelihood) contrasta si el decremento en el “–2Log Likelihood” entre el modelo nulo (sin incluir ninguna variable explicativa) y el modelo final es significativo, siendo el número de grados de libertad del estadístico de contraste el número de variables explicativas). No rechazar la hipótesis nula equivale a aceptar que conjuntamente las variables explicativas no son relevantes en el modelo (sus coeficientes son todos nulos). La medida de efecto de cada variable se calcula a través del Odds Ratio que viene dado por la exponencial del coeficiente. Los intervalos de confianza del 95% de cada Odds Ratio vienen dados por

(exp(b j − 1.96 EE(b j )), exp(b j + 1. 96 EE(b j )))
Un OR significativamente mayor que uno indica que un incremento en la variable explicativa se asocia a un incremento en el Odds de la variable respuesta. Igualmente, un OR significativamente menor que uno indica que un incremento en la variable explicativa se asocia a un decremento en el Odds de la variable respuesta. El OR se considerará significativamente diferente de 1 si es significativamente distinto de cero el coeficiente correspondiente en el modelo Para realizar la tabla de clasificación, se calcula para cada individuo i la probabilidad estimada de ocurrencia que viene dada por
Prob = i 1 1 + exp − b0 + b1x1i + ... + bpxpi

( (

))

Si Probi>=Punto de corte que define el usuario entonces se predice "el valor que se esté modelizando en la ventana de opciones del modelo", en caso contrario se predice "el valor que no se esté modelizando ". La tabla de clasificación resulta de cruzar la variable respuesta observada con la predicha. El porcentaje de casos correctamente pronosticados puede entenderse como un estimador de la calidad de ajuste del modelo, aunque éste siempre estará sesgado hacia valores altos debido a que los mismos casos que han permitido estimar el modelo son los que se están pronosticando.

Manual G-Stat 2.0 Manejo del programa

217

Variables: Se identifica la Variable respuesta dicotómica o binaria (b) y la(s) Variable(s) explicativa(s) cuantitativas. Las variables no deben tener varianza cero. Estadísticos: Estadísticos de las variables explicativas para cada nivel de la variable respuesta. Se detallan en Cuantitativa (y). Sólo se tienen en cuenta los registros completos para todas las variables analizadas. Modelo: Se muestra el proceso iterativo de disminución del estadístico “-2Log Likelihood”, la ecuación del modelo, los “Odds ratio” y la tabla de clasificación. Opciones: - Si se quiere incluir o no el término constante. - Código de ocurrencia que se quiere modelizar de la variable respuesta dicotómica. - Selección de variables: incluir todas, aplicar un procedimiento paso a paso hacia adelante o hacia detrás. - Valor del punto de corte que se utilizará para generar la tabla de clasificación que proporciona el modelo. - Nivel de significación p para entrar y para salir en el proceso secuencial de selección del modelo: las variables van entrando en el modelo si realmente lo mejoran más allá de lo que podría deberse al azar (p-para-entrar) y pueden salir si no mejoran el modelo significativamente (con relación a p-para-salir). - Valor alfa para construir los intervalos de confianza para el OR asociado a cada variable explicativa del modelo. En las opciones el valor por defecto de alfa es 5% que corresponde a un IC del 95%. Alfa debe ser >0 y <100. - Número máximo de iteraciones que se permite. Por defecto, el programa tiene marcadas las opciones: incluido el término constante, código de ocurrencia igual al primer valor en el fichero de datos para la variable respuesta, incluidas todas las variables, punto de corte 0.5, p-para-entrar y p-parasalir con valor 0.1, alfa de un 5% y el número máximo de iteraciones es 20.

218 En presencia de separación o cuasiseparación los estimadores de máxima verosimilitud no existen. No obstante, se presentan los resultados que se deducen de la última iteración. En estos casos la validez del modelo es cuestionable. Aunque el algoritmo utilizado es robusto en la mayoría de situaciones, no se asegura la convergencia en todos los casos.

Menú de opciones de la regresión logística en Modelo. Predicciones: Para cada caso se presentan la predicción por el modelo y su residuo. En opciones se debe redefinir el modelo tal y como se definió en la pestaña Modelo. Las ventanas de opciones no están conectadas en todo el programa, por lo que cualquier cambio en una pestaña debe realizarse nuevamente en las demás si se desean resultados coherentes.

:

Se desea modelizar la variable Fumador, con código de ocurrencia

igual a 2, mediante las variables Sexo, Edad y FC2FC1. Estadísticos en la regresión logística.
Regresión Logística. Estadísticos ====================================================================== Variable Respuesta: Variable(s) Explicativa(s): Número de Casos: FUMADOR SEXO, EDAD, FC2FC1 40

Manual G-Stat 2.0

219

Variable=SEXO Desviación FUMADOR N Media Mediana Típica Mínimo Máximo ------------------------------------------------------------------2 24 1.5000 1.5000 0.5108 1.0000 2.0000 1 16 1.3750 1.0000 0.5000 1.0000 2.0000 ------------------------------------------------------------------Total 40 1.4500 1.0000 0.5038 1.0000 2.0000 Variable=EDAD Desviación FUMADOR N Media Mediana Típica Mínimo Máximo --------------------------------------------------------------------2 24 22.5833 22.7500 1.3871 19.5000 25.6000 1 16 22.1625 21.9500 1.5209 20.0000 25.4000 --------------------------------------------------------------------Total 40 22.4150 22.5500 1.4380 19.5000 25.6000 Variable=FC2FC1 Desviación FUMADOR N Media Mediana Típica Mínimo Máximo --------------------------------------------------------------------2 24 60.0417 59.5000 10.8847 42.0000 82.0000 1 16 64.3125 67.0000 10.9527 42.0000 82.0000 --------------------------------------------------------------------Total 40 61.7500 61.0000 10.9772 42.0000 82.0000

Resultados de la opción Modelo en la regresión logística.
Regresión Logística. Modelo ===================================================================== Variable Respuesta: Valor modelizado (ocurrencia): Variable(s) Explicativa(s): Número de Casos: Número de Casos con FUMADOR = 2 : Número de Casos con FUMADOR = 1 : FUMADOR FUMADOR = 2 SEXO, EDAD, FC2FC1 40 24 16

El modelo ha convergido satisfactoriamente Función Logaritmo de la Verosimilitud LL (Log Likelihood) ------------------------------------------------------------2 Log Likelihood = 53.8409 (Modelo Nulo) -2 Log Likelihood = 49.8110 -2 Log Likelihood = 49.7624 -2 Log Likelihood = 49.7623 -2 Log Likelihood = 49.7623 (Modelo Final)

7225 1.6459 13.0000 % Índices de Diagnóstico ---------------------------------------Valor Predictivo Positivo = 0.0969 Nagelkerke = 0. p-valor R --------------------------------------------------------------------SEXO 1.0%sup ---------------------------------------------SEXO 2.0000 Variable OR IC95.1611 0.3125 Indice de Youden = 0.0968 0.50)) ---------------------------------------------------------| Predicción | | Observados | 2 | 1 | % Correcto ---------------------------------------------------------2 | 19 | 5 | 79.2500 % ---------------------------------------------------------| | | 60. E.1334 2.7140 0.0000 FC2FC1 -0. 3.8624 21.1667 % 1 | 11 | 5 | 31.1915 FC2FC1 0.0000 EDAD -0.0786.2531 R Cuadrado del Modelo: ------------------------Cox-Snell = 0. .5571 0.5000 Sensibilidad = 0. p-valor = 0.220 Ajuste del Modelo (Diferencia de Likelihood) ----------------------------------------------------------------Chi-Cuadrado = 4.7415 1 0.1042 Regresión de Cox (xz|y cens) Realiza la regresión de Cox que modeliza una variable respuesta cuantitativa censurada por la derecha en función de una o varias variables explicativas cuantitativas.8843 EDAD 0. G.L.7826 1.8448 1 0.0980 1.9946 0.3332 0.6333 Valor Predictivo Negativo = 0.8754 0.9640 1 0.1331 0.E.0607 Tabla de Clasificación para FUMADOR (Punto de corte = 0.3892 0.7917 Especificidad = 0.9366 1 0.L.5407 0.0000 CONSTANTE 20.0%inf IC95.1744 0. Wald G. Adicionalmente se muestran las gráficas de las funciones de supervivencia por el método de Kaplan-Meier.1310 Regresión Logística: --------------------------------------------------------------------Variable Coef.6149 0.

Manual G-Stat 2. ….ej.0 Kaplan-Meier 221 Gráfico de las curvas de supervivencia para cada categoría de cada posible variable explicativa cualitativa mediante el procedimiento de Kaplan-Meier.. m=1. El procedimiento de maximización se realiza por el método iterativo de Newton-Raphson. xp) es la función de riesgo para un individuo con perfil (x1. r. xp =0 y b j está asociado a la variable explicativa jésima. Estas curvas se interpretan como la probabilidad de “sobrevivir” a un tiempo dado y permiten identificar cuartiles de interés (p. xp es h t. x2.. Estos coeficientes se determinan maximizando la función de verosimilitud de la muestra. …. xp ) a tiempo t y h0(t) representa la función de riesgo basal para un individuo con x1=0.. es decir con información parcial. Si las curvas se cortan estamos ante una situación de modelos no proporcionales. …. La forma de calcular la estimación de Kaplan-Meier para cada grupo m. El modelo de regresión de Cox para p variables explicativas x1. Si las curvas se cortan estamos ante una situación de modelos no proporcionales y se desaconseja el uso de la regresión de Cox como modelo de estimación. x p = h 0 (t ) ⋅ exp b1x 1 + .. + b px p ( ) ( ) donde h(t. también facilita sus errores estándar. …. ….. A partir de los coeficientes bj y de los errores estándar EE(bj) se construye el estadístico de contraste de Wald con . la mediana). x2. x2 . La particularidad de esta técnica es que trabaja con datos censurados. es S( tmj) = ∏ j nmi − dmi nmi i =1 siendo tm1<tm2<…<t mk los tiempos ordenados de ocurrencia de suceso para el grupo m. nmj el número de individuos en riesgo del grupo m en t y dmj el mj número de individuos del grupo m que experimentan el suceso en tmj. disminuyendo en cada iteración el “–2Log Likelihood”. x2=0. x2. x1. Este método además de proporcionar los coeficientes del modelo. . Regresión de Cox La regresión de Cox se utiliza cuando se quiere analizar la variable respuesta “tiempo hasta que ocurre un suceso” en función de varias variables explicativas. x1 . hasta alcanzar su valor mínimo en el modelo final.

96 EE ( b j )). exp b j + 1. a una disminución en la supervivencia. 96 EE b ( ( j ))) Un HR significativamente mayor que uno indica que un incremento en la variable explicativa se asocia a un incremento en el riesgo y. El coeficiente de correlación parcial R se calcula como R= Waldj − 2 − 2LL(0) donde –2LL(0) es menos dos veces el logaritmo neperiano de la función de cuasi-verosimilitud en el paso inicial (paso cero). El signo de R es el signo del coeficiente. la Variable de censura dicotómica y la(s) Variable(s) explicativa(s) cuantitativas. por tanto. Igualmente. siendo el número de grados de libertad del estadístico de contraste el número de variables explicativas). por tanto. a un aumento en la supervivencia. El HR se considerará significativamente diferente de 1 si es significativamente distinto de cero el coeficiente correspondiente en el modelo Manejo del programa Variables: Se identifica la Variable respuesta cuantitativa. Si Wald es menor que dos.222  bj   Waldj =   EE(b j )    2 que sigue una Chi-Cuadrado con 1 grado de libertad. La medida de efecto de cada variable se calcula a través del “Hazard Ratio” (HR) que viene dado por la exponencial del coeficiente. se considera R igual a cero. El contraste de ajuste del modelo (Diferencia de Likelihood) contrasta si el decremento en el “–2Log Likelihood” entre el modelo nulo (sin incluir ninguna variable explicativa) y el modelo final es significativo. Los intervalos de confianza del 95% de cada “Hazard Ratio” vienen dados por (exp ( b j − 1. un HR significativamente menor que uno indica que un incremento en la variable explicativa se asocia a un decremento en el riesgo y. Las variables no deben tener varianza cero. . No rechazar la hipótesis nula equivale a aceptar que conjuntamente las variables explicativas no son relevantes en el modelo (sus coeficientes son todos nulos).

. Opciones: . Kaplan-Meier Gráfico: Para cada tiempo exacto se incluye. según el método de Kaplan-Meier. según el método de Kaplan-Meier.0 223 Estadísticos: Estadísticos de las variables explicativas para cada nivel de la variable censura. los “Odds ratio” y la tabla de clasificación. Sólo se tienen en cuenta los registros completos para todas las variables analizadas.Se identifica código para datos censurados. Opciones: .Selección de variables: incluir todas. Modelo: Se muestra el proceso iterativo de disminución del estadístico “-2Log Likelihood”. .Manual G-Stat 2. la curva de probabilidad de supervivencia. . aplicar un procedimiento paso a paso hacia adelante o hacia detrás. la ecuación del modelo.Se identifica código para datos censurados. . Opciones: . .Se identifica código para datos censurados.Obtener las probabilidades de supervivencia para todos los casos o estratificarlas por grupos de una variable explicativa del modelo. Se detallan en Cuantitativa (y).Obtener las probabilidades de supervivencia para todos los casos o estratificarlas por grupos de una variable explicativa del modelo.Nivel de significación p para entrar y para salir en el proceso secuencial de selección del modelo: las variables van entrando en el modelo si realmente lo mejoran más allá de lo que podría deberse al azar (p-para-entrar) y pueden salir si no mejoran el modelo significativamente (con relación a p-para-salir). máximo e incremento del eje X y del eje Y. la probabilidad de supervivencia y la mediana del tiempo de supervivencia. el mínimo. . el título.La cabecera. Kaplan-Meier Tabla: Para cada tiempo exacto se incluye.

Número máximo de iteraciones que se permite.224 . Alfa debe ser >0 y <100. incluidas todas las variables.1. En las opciones el valor por defecto de alfa es 5% que corresponde a un IC del 95%. no se asegura la convergencia en todas los casos. Los datos son los siguientes: Meses Cens 12 12 12 23 23 24 24 24 25 25 34 35 35 45 45 45 46 46 45 45 45 34 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 Sexo 1 1 1 0 0 1 1 1 0 0 1 0 0 1 1 1 0 0 1 1 1 0 Antigüedad 2 2 2 2 2 3 3 3 2 2 6 4 4 6 6 6 5 5 4 5 5 6 Edad 45 45 45 34 34 23 23 23 34 34 45 56 56 45 45 45 34 34 23 34 34 45 . el programa tiene marcadas las opciones: código de censura igual al primer valor en el fichero de datos para la variable censura. .Valor alfa para construir los intervalos de confianza para el OR asociado a cada variable explicativa del modelo. alfa de un 5% y el número máximo de iteraciones es 20. Aunque el algoritmo utilizado es robusto en la mayoría de situaciones. p-para-entrar y p-para-salir con valor 0. : Se desea modelizar la variable Meses mediante las variables Sexo. Por defecto. Antigüedad y Edad mediante un modelo de regresión de Cox utilizando Cens como variable de censura (código=0) y el resto de variables como variables explicativas.

7017 23.4956 0.0000 1.5032 0.2632 34.Manual G-Stat 2.0000 1.3333 23.0000 12.6316 1.0000 1.0 Resultados estadísticos parciales.0000 Variable=sexo Desviación cens N Media Mediana Típica Mínimo Máximo ----------------------------------------------------------------1 19 0. Regresión de Cox. . edad 22 225 Curvas de la función de supervivencia por Kaplan-Meier para los grupos formados por la variable Sexo con código de dato censurado=0.5774 0.0000 12.0000 34.0000 0 3 0.3333 0.0000 meses cens sexo.0000 12.0000 0.0000 0 3 30.3641 12.0000 46.1185 12.0000 0. Estadísticos ====================================================================== Variable Respuesta: Variable de Censura: Variable(s) Explicativa(s): Número de Casos: Variable=meses Desviación cens N Media Mediana Típica Mínimo Máximo -------------------------------------------------------------------1 19 32. anti.0000 46.0000 45.0000 0.0000 ----------------------------------------------------------------Total 22 0.5909 1.0000 -------------------------------------------------------------------Total 22 32.

226 Resultados del Modelo de la regresión de Cox.0002 Regresión de Cox -------------------------------------------------------------------Variable Coef.5059 8. Regresión de Cox. G.6141 -2 Log Likelihood = 68. p-valor = 0. anti.3910 1 0.0299 0.6141 (Modelo Final) Ajuste del Modelo (Diferencia de Likelihood) -----------------------------------------------------------------Chi-Cuadrado = 20.1748 Variable HR IC95.7028 1.0105 1.L. edad 22 3 19 Número de casos excluidos (*): 0 (*) Correspondientes a casos censurados antes del primer evento Función Logaritmo de la Verosimilitud LL (Log Likelihood) ------------------------------------------------------------2 Log Likelihood = 88.2682 edad 0. 3.0494 4.4654 0. p-valor R -------------------------------------------------------------------sexo 2.6226 edad 1.2310 0.7147 1 0.1463 anti -1.9217 1.0038 -0.3077 -2 Log Likelihood = 68.1072 0.2263 .3683 3.1132 1.2047. Modelo ====================================================================== Variable Respuesta: Variable Censura: Valor asociado al dato censurado: Valor asociado al dato exacto: Variable(s) Explicativa(s): Número de Casos: Número de casos censurados: Número de casos exactos: meses cens cens=0 cens=1 sexo. Wald G.8187 (Modelo Nulo) -2 Log Likelihood = 70.L. E.7764 -2 Log Likelihood = 68.0211 218.0857 0.6141 -2 Log Likelihood = 68.0%inf IC95.0%sup ----------------------------------------------sexo 14.0482 0. con selección de todas las variables sin mostrar las iteraciones.E.0465 anti 0.9016 1 0.6199 -2 Log Likelihood = 68.

Estas opciones conectan con la pagina www. Este menú contiene las opciones relacionados con la ayuda del programa.es. . Acerca de G-Stat Contiene información actualizada sobre los créditos del programa y condiciones de utilización. Dónde Encontrar Contiene las rutas de los diferentes análisis y técnicas estadísticas contenidas en este programa.Manual G-Stat 2. donde se encuentra actualizada dicha información.g-stat.0 227 Menú Ayuda Activar la opción Ayuda del menú principal o mediante Alt+Y. Manual del G-Stat Contiene información actualizada en Internet sobre este manual.

228 .

Boston. L.N. Modelling Binary Data. Juez. Nizam. Grove. 1981.M. Estadística Fácil. New York. Box. Raghavarao. Diaz de Santos. Fleiss. 1993.. Oxford. J. F. New York. Hosmer. G. New York. J... Londres. Statistical Methods for Rates and Proportions.C.S. W.E. Statistical Methods in Medical Research. Muller. Statistics. 2004. Aplicada a las Ciencias Sociales. 1984.W. Chapmam & Hall/CRC. John Wiley & Sons. Grijalbo.. Lemeshow. HaperPerennial. D. Applied Nonparametric Company.Manual G-Stat 2. K. 1990. M. Applied Regression Analysis and Multivariable Methods.E. Nonparametric statistical methods for complete and censored data. F. John Wiley & Sons. G.The Cartoon Guide to Statistics.. P. 1978. D. D. W. A.L. Chapman & Hall.G. S. Probabilidad y Estadística en Medicina. Modelling Survival Data in Medical Research.S. J. Díez. 1989. Daniel. Duxbury Press. 2002. D. Chapman & Hall. Kleinbaum. Kupper. Clegg. Londres. Collett.. Florida. L. Hunter.. D. Collett. 1991. 1994. Gonick. Pac. Blackwell Science Publications.W.L. PWS-KENT Publishing Desu. Berry.. W. 1996. Statistics for Experimenters. Smith. New York.. Barcelona. Madrid. John Wiley & Sons.G. 1998. Applied Logistic Regression. P.P.0 229 Bibliografía Armitage. .. Matthews. Hunter.

Basel. 118 ejercicios de Estadística Básica aplicados a las Ciencias de la Salud. 1988. M.. New York. Valsecchi. New York. GSK. 2001. New York. Iniciación Estadística.G. Matthews. Biostatistics: The Bare Essentials.E.. 1980.T. D.. W. Norman. Statistical Methods. John Wiley & Sons. 1994. S. Karger. 1994.230 Lee. Analysing Survival Data from Clinical Trials and Observational Studies. A. G.. E... V. Planning Pharmaceutical Clinical Trials. Using and Understanding Medical Statistics. 1994. S. 1993. Marcel Dekker.G. Madrid. Ríos. Letón. D. Marubini. 1992. Snedecor. Madrid.T. A. Madrid. E. Madrid.. Streiner. Mosby Year Book. C. Sense and Nonsense of Statistical Inference. . Pedromingo. St. E.A. 1996. Statistical Methods for Survival Data Analysis. 1995. Wang. Corchran. Wooding. Louis.. John Wiley & Sons. E. Iowa. Pedromingo. John Wiley & Sons. Fundamentos Teóricos del Análisis de Supervivencia. GSK. Pedromingo. Paraninfo. Díaz de Santos. Farewell. Introducción al Análisis de Datos en Meta-Análisis. W. 1992.W. G.M. Chichester. The Iowa State University Press. E. A. Letón. Letón.

Sign up to vote on this title
UsefulNot useful