Está en la página 1de 253

PASADO

Estadsticas paleontolgicos

versin 3.15

Manual de referencia

yvind Hammer

Museo de Historia Natural

Universidad de Oslo

ohammer@nhm.uio.no

1999- 2017

1
Contenido

Bienvenido al pasado! .................................................. .................................................. ..................... 11

Instalacin ................................................. .................................................. ........................................ 12

Inicio rpido ................................................ .................................................. .......................................... 13

Cmo puedo exportar los grficos? .................................................. .................................................. ............ 13

Cmo puedo organizar los datos en grupos? .................................................. .............................................. 13

La hoja de clculo y el men Editar ............................................ .................................................. ...... 14

Ingresando datos ................................................ .................................................. .................................. 14

Seleccin de reas ................................................ .................................................. ............................... 14

Mover una fila o una columna ............................................ .................................................. .................. 14

Cambiar el nombre de filas y columnas .............................................. .................................................. ........... 15

El aumento del tamao de la matriz ............................................ .................................................. .......... 15

Cortar, copiar, pegar ............................................. .................................................. ................................. 15

Retirar ................................................. .................................................. ......................................... 15

colores de las filas y smbolos .............................................. .................................................. ................... 15

Seleccin de tipos de datos para las columnas, y especificando los grupos ......................................... ........................ 15

Retire poco informativos filas / columnas ............................................. ................................................ diecisis

Transponer ................................................. .................................................. ...................................... diecisis

columnas agrupadas a Multivar .............................................. .................................................. .......... diecisis

filas agrupadas a Multivar .............................................. .................................................. ................ 17

Observaciones al cuadro de contingencia .............................................. .................................................. ... 17

Apilar filas agrupadas en columnas ............................................. .................................................. ..... 17

pares de valores a la matriz .............................................. .................................................. ........................ 17

Las muestras a eventos (UA para RASC) .......................................... .................................................. ........... 17

2
Eventos a las muestras (RASC a UA) .......................................... .................................................. ........... 17

Cargar y guardar los datos .............................................. .................................................. ................... 18

La importacin de datos desde Excel .............................................. .................................................. ................ 18

La lectura y escritura de archivos Nexus ............................................. .................................................. ........ 19

Mostrador ................................................. .................................................. ......................................... 19

men Transformar ................................................ .................................................. ................................. 20

Logaritmo ................................................. .................................................. ...................................... 20

Restar significar ................................................ .................................................. ................................ 20

Retire tendencia ................................................ .................................................. ................................. 20

porcentaje Fila ................................................ .................................................. ............................. 20

Box-Cox ............................................... .................................................. ........................................... 20

Retire tamao desde distancias .............................................. .................................................. ............. 21

Seales, Procrustes apropiado .............................................. .................................................. ........... 21

Seales, Bookstein ajuste .............................................. .................................................. ............ 22

Proyecto de espacio tangente AN NO EN EL PASADO 3 ......................................... ........................................... 22

Retire el tamao de puntos de referencia AN NO EN EL PASADO 3 ......................................... .................................... 23

Transformar puntos de referencia ................................................ .................................................. ..................... 23

interpolacin regular ................................................ .................................................. ..................... 23

Evaluar la expresin ................................................ .................................................. ........................ 23

men Plot ................................................ .................................................. ........................................... 25

Grafico ................................................. .................................................. ............................................ 25

grfico XY ................................................ .................................................. ......................................... 26

grfico XY con barras de error ............................................. .................................................. .................... 27

Histograma ................................................. .................................................. ...................................... 28

grfico de barras trama / cuadro ............................................. .................................................. ............................. 29

Grfico de sectores ................................................ .................................................. ......................................... 30

grfico apilado ................................................ .................................................. .................................. 30

3
Percentiles ................................................. .................................................. ..................................... 31

grfico de probabilidad normal ............................................... .................................................. ................... 32

................................................. ternaria .................................................. .......................................... 33

parcela de burbujas ................................................ .................................................. ..................................... 34

dispersin 3D / parcela burbuja ............................................. .................................................. ...................... 35

parcela matriz ................................................ .................................................. ...................................... 36

Superficie ................................................. .................................................. .......................................... 37

parcela mosaico ................................................ .................................................. ..................................... 38

men de estadsticas ................................................ .................................................. ................................... 39

................................................. univariado .................................................. ...................................... 39

pruebas de una muestra .............................................. .................................................. ............................. 42

De una muestra t prueba para la media dada 0 ( paramtrico) ................................................ ...................... 42

De una muestra de prueba de Wilcoxon de rangos con signo de media dada M ( no paramtrico) ............................. 43

pruebas de caso nico .............................................. .................................................. ............................... 43

pruebas de dos muestras .............................................. .................................................. ............................. 45

t de prueba y ensayos relacionados sobre medias iguales ........................................... ............................................ 45

F prueba para varianzas iguales .............................................. .................................................. ............. 47

prueba de Mann-Whitney para la igualdad de las medianas ........................................... .............................................. 48

prueba de la mediana del estado de nimo por la igualdad de las medianas ............................................ ............................................ 49

prueba de Kolmogorov-Smirnov para distribuciones iguales ........................................... ............................. 49

Coeficiente de variacin (test Fligner-Kileen) ......................................... ........................................ 51

F y t pruebas de parmetros ............................................... .................................................. ......... 52

Dos muestras pares de pruebas ( t, firmar, Wilcoxon) .............................................. ....................................... 53

pruebas de varios de muestra .............................................. .................................................. ........................ 55

ANOVA de una va .............................................. .................................................. .......................... 55

Kruskal-Wallis ............................................... .................................................. .............................. 58

Varios-muestras repetidas pruebas de medidas ............................................ ........................................... 61

4
pruebas post-hoc de Tukey pairwise ............................................ .................................................. ...... 62

prueba de Friedman ................................................ .................................................. ............................. 62

ANOVA de dos vas .............................................. .................................................. .............................. sesenta y cinco

ANOVA de dos vas sin replicacin ............................................ .................................................. . 68

De dos vas ANOVA de medidas repetidas ............................................ .................................................. 69

Unidireccional ANCOVA .............................................. .................................................. ............................ 70

Tabla de correspondencias ................................................ .................................................. ............................ 71

de correlacin intraclase ................................................ .................................................. ...................... 74

pruebas de normalidad ................................................ .................................................. ............................... 76

Tabla de contingencia (Chi 2 etc.) ............................................... .................................................. ............ 79

prueba de Cochran-Mantel-Haenszel ............................................ .................................................. ........... 81

Riesgo / probabilidades ............................................... .................................................. ......................................... 83

proporcin nica ................................................ .................................................. ............................ 85

intervalos de confianza mltiples proporcin .............................................. ........................................... 86

El anlisis de supervivencia (curvas de Kaplan-Meier, la prueba de log-rank etc.) ................................... ............................ 87

Combinar errores ................................................ .................................................. .............................. 89

Men Multivar ................................................ .................................................. .................................... 90

Componentes principales ................................................ .................................................. ..................... 90

coordenadas principales ................................................ .................................................. ...................... 94

MDS no mtricos .............................................. .................................................. ............................... 95

El anlisis de correspondencia ................................................ .................................................. ................ 97

anlisis de correspondencia Detrended ............................................... ................................................. 99

de correspondencia cannica ................................................ .................................................. ........... 100

Seriacin ................................................. .................................................. ...................................... 101

anlisis factorial CABFAC, an no en los ltimos 3 ......................................... .......................................... 102

Anlisis discriminante ................................................ .................................................. .................... 103

PLS de dos bloques .............................................. .................................................. ................................ 105

5
Anlisis de conglomerados ................................................ .................................................. ............................. 106

Vecino unirse ................................................ .................................................. ......................... 108

K-means clustering .............................................. .................................................. ......................... 109

normalidad multivariante ................................................ .................................................. ................. 110

caja de METRO .................................................. .................................................. ....................................... 111

MANOVA ................................................. .................................................. ..................................... 113

Unidireccional ANOSIM .............................................. .................................................. ........................... 114

Unidireccional PERMANOVA .............................................. .................................................. ................... 115

Bidireccional ANOSIM .............................................. .................................................. .......................... 116

Bidireccional ANOSIM sin replicacin ............................................ ............................................... 116

Bidireccional PERMANOVA .............................................. .................................................. ................... 117

prueba de Mantel y prueba de Mantel parcial ............................................ .................................................. . 118

SIMPER ................................................. .................................................. ........................................ 120

Emparejado Hotelling ................................................ .................................................. ............................ 121

Tcnica analgica moderna ............................................... .................................................. ............ 122

Similitud y distancia ndices .............................................. .................................................. ....... 124

Estadsticas secuencia gentica ............................................... .................................................. ................. 130

men Modelo ................................................ .................................................. ..................................... 131

Lineal, de dos variables ............................................... .................................................. ............................. 131

Linear, multivariado (uno independiente, n dependiente) ........................................ ........................... 135

Linear, mltiple (un dependiente, n independiente) ........................................ ................................. 136

Linear, mltiple multivariante (m independiente, n dependiente) ....................................... ................. 137

Modelo Lineal Generalizado ............................................... .................................................. ............. 138

regresin polinmica ................................................ .................................................. .................. 140

No lineal ................................................. .................................................. ..................................... 141

Lineal................................................. .................................................. ....................................... 141

................................................. cuadrtica .................................................. ................................. 141

6
Poder ................................................. .................................................. ...................................... 142

Exponencial................................................. .................................................. .............................. 142

Von Bertalanffy ................................................ .................................................. ........................ 142

De Michaelis-Menten ............................................... .................................................. ..................... 142

Logstico................................................. .................................................. ..................................... 142

Gompertz ................................................. .................................................. ................................ 143

................................................. de Gauss .................................................. .................................. 143

regresin sinusoidal ................................................ .................................................. .................... 144

Suavizado de spline ................................................ .................................................. .......................... 146

suavizado loess ................................................ .................................................. .......................... 147

anlisis de mezclas ................................................ .................................................. ........................... 148

modelos de abundancia ................................................ .................................................. ....................... 150

Especies de embalaje (gaussiana) ............................................. .................................................. .............. 152

espiral logartmica ................................................ .................................................. ......................... 153

men de la diversidad ................................................ .................................................. ................................. 154

Los ndices de diversidad ................................................ .................................................. ........................... 154

riqueza cuadrante ................................................ .................................................. .......................... 156

La diversidad beta ................................................ .................................................. ................................ 159

distincin taxonmica ................................................ .................................................. ................ 161

rarefaccin individual ................................................ .................................................. ................... 163

rarefaccin de la muestra (tau de Mao) ............................................ .................................................. ........ 165

anlisis SHE ................................................ .................................................. .................................. 166

Diversidad prueba de permutacin ............................................... .................................................. ............ 167

Diversidad t prueba ................................................. .................................................. ............................. 168

perfiles de diversidad ................................................ .................................................. .......................... 169

men de tiempo serie ............................................... .................................................. .............................. 170

periodograma sencilla ................................................ .................................................. ..................... 170

7
anlisis espectral REDFIT ............................................... .................................................. ................ 171

anlisis espectral Multitaper ............................................... .................................................. .......... 173

Transformada Walsh ................................................ .................................................. ........................... 174

De corta duracin transformada de Fourier ............................................. .................................................. .......... 175

Transformada wavelet ................................................ .................................................. ....................... 176

Punto espectro de eventos ............................................... .................................................. .................. 178

Autocorrelacin ................................................. .................................................. ........................... 180

Autoasociacin ................................................. .................................................. ........................... 181

La correlacin cruzada ............................................... .................................................. ........................... 183

correlogram Mantel (y periodograma) ............................................ ............................................ 184

Prueba de rachas ................................................ .................................................. ....................................... 186

Mann-Kendall prueba de tendencia ............................................. .................................................. ................. 187

ARMA (y anlisis de intervencin) ............................................ .................................................. .... 188

Insolation modelo (solar forzando) ............................................ .................................................. ....... 190

eventos de punto ................................................ .................................................. ................................. 191

cadena de Markov ................................................ .................................................. ................................ 193

alisadores simples ................................................ .................................................. ......................... 194

filtro FIR ................................................ .................................................. ........................................ 195

Fecha / tiempo de conversin .............................................. .................................................. ..................... 197

Men geomtrica ................................................ .................................................. ............................ 198

Direcciones (una muestra) ............................................. .................................................. .................. 198

Instrucciones (dos muestras) ............................................. .................................................. ................. 201

correlacin Circular ................................................ .................................................. ....................... 203

Esfrica (una muestra) ............................................. .................................................. .................... 204

anlisis del patrn de punto - vecinos ms cercanos ............................................ ....................................... 205

Ripley K anlisis del patrn de punto ............................................... .................................................. .... 207

densidad de Kernel ................................................ .................................................. ............................... 209

8
alineaciones de puntos ................................................ .................................................. .......................... 210

Quadrat cuenta ................................................ .................................................. ............................ 211

Autocorrelacin espacial (I de Moran) ............................................ .................................................. 212 ..

Grillado (interpolacin espacial) ............................................. .................................................. ....... 214

Multivariante NO Alometra AN EN ltimos 3 ........................................... .......................................... 217

PCA de puntos de referencia en 2D (urdimbres relativa) .......................................... .................................................. 218

splines Thin-placa para puntos de referencia 2D ........................................... .................................................. 219 ..

La regresin lineal de puntos de referencia 2D ............................................. .................................................. 219 ..

PCA de monumentos en 3D .............................................. .................................................. ...................... 220

Distancia de puntos de referencia (2D o 3D) todava no est en ltimos 3 ..................................... .......................... 222

Todas las distancias de hitos (EDMA) todava no est en ltimos 3 ...................................... ....................... 222

Punto de referencia que une AN NO EN EL PASADO 3 ........................................... .................................................. 222

anlisis de la forma de Fourier elptica .............................................. .................................................. ......... 223

anlisis de la forma Hangle Fourier .............................................. .................................................. ........ 224

Transformacin de coordenadas ................................................ .................................................. .......... 225

Mapas de Google ................................................ .................................................. ................................ 226

Men estratigrafa ................................................ .................................................. ............................ 227

Asociaciones unitarios ................................................ .................................................. ..................... 227

Clasificacin-Scaling ............................................... .................................................. ............................. 232

optimizacin con restricciones (CONOP) ............................................. .................................................. . 234

intervalos de confianza del rango ............................................... .................................................. ........... 235

intervalos de confianza del rango de distribucin libre ............................................ ...................................... 236

Scripting ................................................. .................................................. .......................................... 237

La estructura del lenguaje ................................................ .................................................. ....................... 237

La ventana de salida ............................................... .................................................. ....................... 243

Acceso a la hoja de clculo principal Pasado ............................................. ................................................ 244

Matriz y el vector de operaciones .............................................. .................................................. ........... 245

9
funciones matemticas escalares ............................................... .................................................. .................... 245

File I / O .............................................. .................................................. ............................................ 246

Operaciones con cadenas de ................................................ .................................................. .......................... 247

Otras funciones ................................................ .................................................. ............................ 249

Llamar a las funciones DLL (slo Windows) ........................................... .................................................. . 249

Bibliotecas y clases ............................................... .................................................. ...................... 251

Formas y componentes ............................................... .................................................. ................. 251

10
Bienvenido al pasado!

Este programa fue diseado originalmente como un seguimiento de PALSTAT, un paquete de software para anlisis de datos paleontolgicos
escrito por PD Ryan, DAT Harper y JS Whalley (Ryan et al., 1995). Mediante el desarrollo continuo durante ms de 15 aos, pasado ha crecido
hasta convertirse en un paquete integral estadsticas utilizado no slo por los paleontlogos, pero en muchos campos de la ciencia de la vida,
ciencias de la tierra, ingeniera y economa.

Ms explicaciones de muchas de las tcnicas implementadas junto con historias de casos se encuentran en el libro anlisis de los
datos paleontolgicos (Martillo y Harper, 2005).

Si tiene alguna pregunta, informes de errores, sugerencias de mejora u otros comentarios, estaremos encantados de saber de usted.
Contactanos en ohammer@nhm.uio.no . Para informes de errores, recuerde que debe enviar los datos utilizados, como se salv del pasado,
junto con una descripcin completa de las acciones que conducen al problema.

La ltima versin del pasado, junto con la documentacin y un enlace a la lista de correo Pasado, se encuentran en

http://folk.uio.no/ohammer/past

Estamos muy agradecidos si usted cita del pasado en las publicaciones cientficas. La referencia oficial es Hammer et al. (2001).

referencias

Hammer, . Y Harper, DAT 2006. Anlisis de Datos Paleontolgico. Blackwell.

. Hammer, , Harper, DAT, y PD Ryan, 2001. PASADO: Paleontolgico Estadsticas paquete de software para la Educacin y el
anlisis de datos. Palaeontologia Electronica 4 (1): 9pp.

Harper, DAT (ed.). 1999. numrica Paleobiologa. John Wiley & Sons.

11
Instalacin

ventanas

Slo tiene que descargar el archivo 'Past3.exe' (descomprimido) o 'Past3.zip' (en zip) y ponerlo en cualquier lugar en su disco duro. Haga doble clic

en el archivo comenzar el programa. Windows considerar esto como una violacin de seguridad, y le preguntar si confa en el proveedor de

software. Si desea utilizar el programa, que tendr que responder s.

Se sugiere hacer una carpeta llamada 'pasado' en cualquier parte de su disco duro, y poner todos los archivos de esta carpeta.

La falta de instalacin formal de Windows es intencional, y permite la instalacin sin privilegios de administrador.

Mac

Para Mac, descargar el paquete 'DMG'. Es probable que tenga para permitir que el sistema para instalar aplicaciones que no sean de la

AppStore o desarrolladores identificados.

Ir a Preferencias del Sistema


Elija Seguridad y Privacidad
Haga clic en el pequeo candado (inferior izquierda) e introduzca su contrasea

Seleccione cualquier lugar de la "Permitir aplicaciones descargadas desde" opcin

Ejecutar el Past.dmg (haga clic en el archivo).

A continuacin, restaure las opciones de seguridad para Mac App Store o Mac App o desarrolladores identificados.

12
Inicio rpido
El pasado es, en cierta medida explica por s mismo, pero un par de funciones importantes son un poco difcil de encontrar:

Cmo puedo exportar los grficos?

Para una calidad de publicacin, guardar el grfico en el formato vectorial SVG o PDF. Haga

clic en el botn "Configuracin de grficos" al lado de la grfica. En la ventana de preferencias

de grfico, haga clic en el botn de "exportacin de imagen" (flecha a la derecha). Puede abrir

archivos SVG en Adobe Illustrator, Corel Draw o el programa libre Inkscape. archivos SVG son

compatibles con la mayora de los navegadores web, y se pueden colocar directamente en una

pgina web.

Tambin puede exportar la imagen en formatos de mapa de bits (JPG, TIF, etc.), pero
la calidad es baja y no se puede editar fcilmente el grfico. O bien, puede copiar y
pegar la imagen como un mapa de bits haciendo clic en el botn "Copiar" en el grfico.

Cmo puedo organizar los datos en grupos?

Esto requiere una columna de grupo separado, con un identificador de grupo para cada fila. En el ejemplo (1) hay un grupo columna "litologa", con dos

grupos LS y MS. Para especificar que "litologa" es una columna de grupo, primero seleccione la casilla de "atributos columna" por encima de la hoja de

clculo. Esto mostrar dos filas adicionales en la parte superior de la hoja de clculo (2). A continuacin, haga clic en un par de veces en la celda "tipo" de

la columna de grupo, para que aparezca un men en el que se selecciona "Grupo" (3). A continuacin, pulse en otro lugar de actualizar, y se puede anular

la seleccin de "atributos de columna" si lo desea. La columna grupo ahora debe ser marcado con una G (4).

1) 2)

3) 4)

13
La hoja de clculo y el men Editar

Pasado tiene una interfaz de usuario de hoja de clculo. Los datos se introducen como una matriz de clulas, organizada en filas (horizontalmente) y

columnas (verticalmente).

Ingresando datos

Para introducir datos en una celda, haga clic en la celda con el ratn y el tipo de los datos. Las clulas tambin se pueden navegar con las teclas de

flecha. Cualquier texto puede introducirse en las clulas, pero la mayora de las funciones se esperan nmeros. Tanto coma (,) y el punto decimal (.)

Se aceptan como separadores decimales.

datos de ausencia / presencia se codifican como 0 o 1, respectivamente. Cualquier otro nmero positivo ser interpretado como presencia. Ausencia /

presencia-matrices se pueden mostrar con los cuadrados negros para presencias marcando la casilla 'modo Square' por encima de la matriz.

sequence data gentica se codifican usando C, A, G, T y U (minsculas tambin aceptada).

Los datos que faltaban se codifican con signos de interrogacin ( '?'). A menos que el apoyo a los datos que faltan se indique especficamente en la

documentacin para una funcin, la funcin no manejar correctamente los datos que faltan, as que ten cuidado.

La convencin en el pasado es que los elementos ocupan filas y columnas de variables. por lo tanto, tres individuos braquipodos pueden ocupar las
filas 1, 2 y 3, con sus longitudes y anchuras de las columnas A y B. Anlisis de clster siempre clster artculos, es decir filas. Para el anlisis en modo
Q de las asociaciones, las muestras (sitios), por tanto, deben introducirse en filas, mientras que los taxones (especies) estn en columnas. Para la
conmutacin entre Q-modo y R-modo, las filas y columnas puede ser fcilmente intercambiar utilizando la operacin de transposicin.

Seleccin de reas

La mayora de las operaciones en el pasado se llevaron a cabo slo en el rea de la matriz que tiene seleccionado

(marcado). Si intenta ejecutar una funcin que espera que los datos, y ninguna zona ha sido seleccionado, recibir un mensaje de error.

Una fila se selecciona haciendo clic en la etiqueta de la fila (ms a la izquierda de la columna).

Una columna se selecciona haciendo clic en la etiqueta de la columna (fila superior).

filas mltiples se seleccionan mediante la seleccin de la primera etiqueta de la fila, a continuacin, SHIFT-clic (haciendo clic con la tecla

Shift) sobre las etiquetas de las filas adicionales.

Varias columnas estn sealadas tambin por el cambio-clic en los ttulos de las columnas adicionales.

Tambin puede seleccionar filas o columnas disjunct ctrl-clic.


Todo el conjunto se puede seleccionar haciendo clic en la esquina superior izquierda de la matriz (la celda gris vaco) o eligiendo
'Seleccionar todo' en el men Editar.

Las reas ms pequeas dentro de la matriz se pueden seleccionar haciendo clic y shift-clic.

Mover una fila o una columna

Seleccione el botn 'Arrastre filas / columnas' en el cuadro 'modo de clic'. Una fila o una columna de ahora se pueden mover simplemente haciendo clic

en la etiqueta y arrastrando a la nueva posicin.

14
Cambiar el nombre de filas y columnas

Cuando se inicia PASADO, las filas estn numeradas del 1 al 99 y las columnas estn etiquetadas A a la Z. Para su propia referencia, y para el
etiquetado adecuado de los grficos, se deben dar las filas y columnas de nombres ms descriptivos, pero cortos.

Seleccionar la opcin '' atributos de fila por encima de la hoja de clculo para ver una columna editable de los nombres de las filas. Seleccionar

la opcin '' atributos de columna para ver una fila editable de los nombres de columna.

El aumento del tamao de la matriz

Por defecto, pasado tiene 99 filas y 26 columnas. Si necesita ms, puede agregar filas o columnas eligiendo 'insertar ms filas' o 'insertar
ms columnas' en el men Editar. Filas / columnas se insertan antes de que el rea marcada, o en la parte inferior derecha si se selecciona
/ ninguna zona. Al cargar archivos de gran tamao, filas y / o columnas se aaden automticamente segn sea necesario.

Cortar, copiar, pegar

El cortar, copiar y pegar funciones se encuentran en el men Editar. Puede cortar / copiar datos de la hoja de clculo pasado y pegarlo en otros
programas, por ejemplo, Word y Excel. Del mismo modo, los datos de otros programas se pueden pegar en el pasado - stos deben estar en un
formato de texto separado por tabuladores.

Antes de pegar, seleccione la celda superior izquierda del rea de hoja de clculo en el pasado que desea pegar en. Tenga cuidado de no pegar en

la columna y la fila posiblemente oculta campos de atributo, a menos que te refieres a.

retirar

La funcin Remove (men Edicin) le permite eliminar fila (s) seleccionada o columna (s) de la hoja de clculo. El rea
eliminada no se copia en el bfer de pegado.

colores y smbolos de la fila

Cada fila se puede dar un (punto de imagen, cruz, cuadrado, etc., o de usuario definido) color y un smbolo. Estos sern utilizados en los diagramas de

dispersin y otras parcelas. Seleccionar la opcin '' atributos de fila para editar las filas y colores de forma individual, o utilizar la funcin de los 'colores

de fila / smbolos' para establecer todas las filas seleccionadas al mismo tiempo (opcionalmente en funcin del grupo, vase ms adelante).

Seleccin de tipos de datos para las columnas, y especificando los grupos

Cada columna se puede dar un tipo de datos utilizando el modo 'atributos de columna'. Seleccione la casilla '' atributos de columna por encima de la

hoja de clculo. A continuacin, haga clic en la celda 'tipo' de la columna un par de veces para que aparezca un pequeo men en el que el tipo de

datos puede ser seleccionado. Los tipos de datos son los siguientes:

Sin especificar (-)

Este es el tipo de datos predeterminado.

15
Ordinal, nominal o binaria

Especificando uno de estos tipos slo es necesario si desea utilizar las medidas de similitud / distancia mixtos.

Grupo

En una columna de grupo, puede introducir identificadores para grupos de datos. Puede utilizar nmeros enteros o cadenas tales como "machos y
hembras '' (sin las apstrofes). Esto permitir a los polgonos o elipses basadas en grupos de grficos de dispersin. Tambin se requiere una columna
de grupo para muchos anlisis, tales como MANOVA. Se recomienda tener filas en el mismo grupo como consecutivos. Algunos anlisis (por ejemplo,
de dos vas ANOVA) requieren dos o incluso ms columnas de grupo.

Tenga en cuenta que a diferencia de las versiones anteriores del pasado, no hay enlaces automticos entre colores, smbolos y grupos. Si desea
utilizar diferentes colores y / o smbolos para los diferentes grupos, puede configurar la columna del grupo primero y luego usar la funcin 'Row
colores / smbolos' en el men Editar para asignar colores / smbolos en consecuencia.

Retire poco informativos filas / columnas

Filas o columnas pueden ser poco informativo especialmente con respecto a los anlisis multivariantes. Tales filas y columnas deben
ser considerados para su eliminacin. Varios tipos se pueden buscar y eliminados: filas o columnas con ceros solamente, filas o
columnas con datos slo faltantes ( '?'), Filas o columnas con slo una clula no-cero (singletons), filas o columnas con valores
constantes ( varianza cero).

Transponer

La funcin de transposicin, en el men Edicin, intercambiar filas y columnas. Esto se utiliza por ejemplo para la conmutacin entre el modo R y
el modo de Q en anlisis de conglomerados, anlisis de componentes principales y seriacin.

columnas agrupadas a Multivar

Se convierte de un formato con los objetos que multivariables se presentan en grupos consecutivos de norte columnas en el formato anterior con un

elemento por fila y todas las variables aleatorias a lo largo de las columnas. por N = 2, dos especmenes y cuatro variables ad, la conversin es de

un 1 segundo 1 un 2 segundo 2

do 1 re 1 do 2 re 2

un 1 segundo 1 do 1 re 1

un 2 segundo 2 do 2 re 2

diecisis
filas agrupadas a Multivar

Se convierte de un formato con los objetos que multivariables se presentan en grupos consecutivos de norte filas al formato anterior con un elemento

por fila y todas las variables aleatorias a lo largo de las columnas. por N = 2, dos especmenes y cuatro variables ad, la conversin es de

un 1 segundo 1

do 1 re 1

un 2 segundo 2

do 2 re 2

un 1 segundo 1 do 1 re 1

un 2 segundo 2 do 2 re 2

Observaciones al cuadro de contingencia


Espera dos columnas de datos. Cada fila es una observacin. Cada columna contiene categoras codificadas como nmeros, por ejemplo,

machos = 0, hembras = 1 en la primera columna; Europea = 1, African = 3, Asian = 5 en la segunda columna. Las ocurrencias de diferentes

combinaciones son contados, dando una tabla de contingencia que puede analizarse con el mdulo de 'Tabla de contingencia' (men univariado).

Apilar filas agrupadas en columnas

grupos Pilas horizontalmente a lo largo de columnas. Esto puede ser por ejemplo til para realizar estadsticas univariantes en pares de columnas a

travs de grupos.

parejas de valores a la matriz

Muy similar a Observaciones a tabla de contingencia. Espera dos columnas de datos, nmeros o cadenas. Cada fila es una observacin. Cada
columna contiene categoras, por ejemplo, Europa, frica, Asia en la primera columna; Perros, gatos, zorros en la segunda columna. Las
ocurrencias de diferentes combinaciones son contados, dando una matriz de datos completo, en este caso con las localidades en las columnas y
taxones en filas.

Las muestras a eventos (UA para RASC)

Dada una matriz de datos de ocurrencias de taxones en un nmero de muestras en un nmero de secciones, tal como se utiliza por el mdulo de
Asociaciones unitarios, esta funcin convertir cada seccin a una sola fila con rdenes de eventos (DCP, muchachos o ambos) como se esperaba
por el mdulo de clasificacin-Escala. eventos atadas (en la misma muestra) se les dar igual ranking.

Eventos a las muestras (RASC a UA)

Espera una matriz de datos con secciones / pozos en filas, y los taxa en columnas, con los valores de FAD y LAD en columnas alternas
(es decir, dos columnas por taxn). Convierte al formato de presencia / ausencia Asociaciones unitario con secciones en grupos de filas,
muestras en filas y taxones en columnas.

17
Cargar y guardar los datos

La funcin 'Abrir' se encuentra en el men Archivo. Tambin puede arrastrar un archivo desde el escritorio a la ventana PASADO. PASADO utiliza un

formato de archivo de texto para facilitar la importacin de otros programas (por ejemplo Word), de la siguiente manera:

La celda superior izquierda debe contener dos puntos (:). Las clulas son separados por tabuladores. Hay dos filas superiores con tipos de datos y los

nombres de las columnas y tres columnas de la izquierda con colores, smbolos y nombres de las filas. Aqu hay un ejemplo:

: - - - Grupo
Lento Medicina Rpido Especies

Negro Punto norte 4 2 3 0


Negro Punto Sur 4 3 7 0
rojo Punto Oeste 18 24 33 1
rojo Punto Este 10 6 7 1

campos opcionales adicionales se pueden agregar al final del archivo:

<Image n> Nombre del archivo Especifica un nombre de archivo de imagen que se utilizar para el smbolo 'Imagen n', n = 1 a 8.

Adems de este formato, con anterioridad tambin puede detectar y abrir archivos en los siguientes formatos:

Excel (slo la primera hoja de clculo).

Nexus (vase ms adelante), popular en sistemtica.

TPS formato desarrollado por Rohlf. Los campos emblemticos, esquemas, curvas, id, y escala de comentario son compatibles, otros
campos se ignoran.
NTSYS. Varias tablas y rboles no son compatibles. El archivo debe tener la extensin'.nts.
FASTA formato de secuencia molecular, especificacin simplificado de acuerdo con NCBI.
PHYLIP formato de secuencia molecular. El archivo debe tener la extensin '.phy'.
formato de secuencia molecular Arlequin. Para el genotipo de datos de los dos haplotipos se concatenan en
una fila. No se admiten todas las opciones.
BioGraph formato de bioestratigrafa (muestras o formato de DATUM). Si se encuentra un segundo archivo con el mismo
nombre pero extensin '.dct', que se incluir como un diccionario BioGraph.
RASC formato de bioestratigrafa. Debe abrir el archivo DAT, y el programa espera correspondientes archivos
.dic y .DEP en el mismo directorio.
CONOP formato de bioestratigrafa. Debe abrir el archivo DAT (archivo de registro), y el programa espera .EVT
correspondiente (evento) y archivos .sct (seccin) en el mismo directorio.

Si no se reconoce el archivo, se supone que es un archivo de texto general, con valores separados por espacios en blanco, tabulaciones o

comas. El programa entonces preguntar sobre el formato del archivo.

La importacin de datos desde Excel

Hay varias maneras de obtener los datos de Excel a pasado.

Copiar desde Excel y pegar en el pasado. Asegrese de hacer clic (elija) de la celda superior izquierda, donde los datos deben ser
colocados en el pasado antes de pegar. Esto depender de si los atributos de fila o columna se incluyen en los datos.

Abra el archivo de Excel del pasado.

Guardar como texto separado por tabuladores en Excel. El archivo de texto resultante se puede abrir en el pasado.

18
La lectura y escritura de archivos Nexus

El formato de archivo Nexus es utilizado por muchos programas de la sistemtica. Pasado puede leer y escribir el bloque de datos (matriz de

caracteres) del formato Nexus. datos entrelazados son compatibles. Adems, si se ha realizado un anlisis de parsimonia y la ventana 'anlisis de

parsimonia' est abierto, todos los rboles ms cortos se escriben en el archivo Nexus para su posterior procesamiento en otros programas (por

ejemplo MacClade o PAUP). Tenga en cuenta que no son compatibles con todas las opciones actualmente Nexus.

Mostrador

Una funcin de contador est disponible en el men Editar para su uso por ejemplo en el microscopio al contar microfsiles de diferentes
taxones. Una sola fila (muestra) debe ser seleccionado. La ventana del contador se abrir con una serie de contadores, uno para cada columna
seleccionada (taxn). Los contadores se inicializan con las etiquetas de columna y cualquier recuentos ya presentes en la hoja de clculo. Al
cerrar la ventana del contador, se actualizarn los valores de la hoja de clculo.

Contar hacia arriba (+) o hacia abajo (-) con el ratn o con las teclas 0-9 y AZ (slo los primeros 36 contadores). Las barras representan la abundancia

relativa. Un registro de eventos se da en el extremo derecho - desplazarse hacia arriba y hacia abajo con las teclas de flecha o el ratn. Una

retroalimentacin auditiva opcional tiene un tono especfico para cada contador.

19
men Transform

Estas rutinas se someten los datos a operaciones matemticas. Esto puede ser til para llevar a cabo funciones en sus datos, o como una
etapa de preprocesamiento necesario para algunos tipos de anlisis.

Logaritmo

La funcin de registro en el men Transformar log-transforma sus datos usando el logaritmo en base 10. Si los datos contienen cero o valores
negativos, puede ser necesario aadir una constante (por ejemplo 1) antes de logtransforming (uso Evaluar expresin x + 1).

Esto es til, por ejemplo, para comparar la muestra a una distribucin logartmica normal o para el montaje a un modelo exponencial. Adems, los
datos de abundancia con una taxones muy dominante pocos pueden log-transformado con el fin de downweight estos taxones.

Los datos que faltan compatibles.

Restar la media

Esta funcin resta la media columna de cada una de las columnas seleccionadas. Los medios no pueden ser calculados de modo de fila.

Faltan valores compatibles.

Retire tendencia

Esta funcin elimina cualquier tendencia lineal a partir de un conjunto de datos (dos columnas con pares XY, o una columna con valores de Y). Esto se

realiza por sustraccin de una lnea de regresin lineal a partir de los valores de Y. Extraccin de la tendencia puede ser una operacin til antes de la

hora anlisis de series tales como el anlisis espectral, auto- y de correlacin cruzada y ARMA.

Los datos que faltan compatibles.

porcentaje de fila

Todos los valores convertidos al porcentaje de la suma fila. Faltan valores compatibles.

Box-Cox

La transformacin de Box-Cox es una familia de transformaciones de energa con el fin de hacer que los datos x
ms normalmente distribuido. La transformacin tiene un parmetro :


1
0

XXY ln 0

20
Si el valor de entrada ms pequeo es cero o negativo (lo que invalidara la transformada), una constante se aade a todos los datos de tal manera

que el valor mnimo de entrada se convierte en 1.

El valor por defecto del parmetro se calcula mediante la maximizacin de la funcin de probabilidad logartmica:

norte
n
L 1 ln2 ln x yo ,
2

yo 1

dnde 2 es la varianza de los datos transformados. Este valor ptimo puede ser cambiado por el usuario, limitado a la gama
-4 4.

Faltan valores compatibles.

Retire tamao desde distancias

Los intentos de eliminar el componente de tamao a partir de un conjunto de datos multivariante de distancias medidas (especmenes en

filas, las variables en columnas). Hay tres mtodos disponibles.

El mtodo de isomtrica Burnaby proyectos del conjunto de distancias medidas en un espacio ortogonal a la primera componente principal.
el mtodo de Burnaby puede (o no!) eliminar tamao isomtrica partir de los datos, para su posterior anlisis de datos "libre de tamao".
Tenga en cuenta que la puesta en prctica en el pasado no se centra los datos dentro de los grupos - se supone que todas las muestras
(filas) pertenecen a un grupo.

El mtodo de alomtrico Burnaby registrar-transformar los datos antes de la proyeccin, por lo tanto la eliminacin de concebible tambin
variacin de la forma dependiente del tamao alomtrico partir de los datos.

Alomtrico vs norma estima coeficientes alomtricos con respecto a una medida estndar (de referencia) L tales como longitud total
(Elliott et al. 1995). Esta variable estndar se debe colocar en la primera columna. Cada columna adicional es retrocedido a la
primera columna despus de la transformacin logartmica, dando una pendiente (coeficiente alomtrico) segundo para esa
variable. Una medicin ajustada se calcula entonces desde el valor original METRO como

segundo


adj
.
LLMM

Referencia

Elliott, NG, K. Haskard y JA Koslow 1995. El anlisis morfomtrico de reloj anaranjado ( Hoplostethus atlanticus) fuera del talud
continental del sur de Australia. Journal of Fish Biologa 46: 202-220.

Seales, apropiado Procrustes

Transforma su punto medido en coordenadas Procrustes. Tambin hay una opcin de men para las coordenadas Bookstein. Las muestras van
en diferentes filas y puntos de referencia a lo largo de cada fila. Si tiene tres ejemplares con cuatro puntos de referencia en 2D, los datos deben
buscar la manera siguiente:

x1 y1 y2 x2 x3 x4 y3 y4 x1 y1

y2 x2 x3 x4 y3 y4 x1 y1 y2 x2

x3 x4 y3 y4

21
Para los datos 3D sern similares, pero con columnas adicionales para z.

datos Landmark en este formato podran analizarse directamente con los mtodos multivariados en el pasado, pero se recomienda para
estandarizar a Procrustes coordina mediante la eliminacin de posicin, tamao y rotacin. Una transformacin adicional a residuos
Procrustes (coordenadas espacio tangente aproximado) se consigue seleccionando 'Reste media' en el men Editar. Debe convertir a
Procusto coordina primero, y luego a residuos Procrustes.

La opcin Girar a eje mayor coloca el resultado en una orientacin estndar para mayor comodidad.

La opcin Mantener el tamao aade un ltimo paso, donde las formas se redujeron a sus tamaos originales del centroide.

Una descripcin exhaustiva de Procusto y el espacio tangente coordenadas viene dada por Dryden y Mardia (1998). Los algoritmos
para Procusto apropiado son de Rohlf y Slice (1990) (2D) y Dryden y Mardia (1998) (3D). Cabe sealar que para 2D, el algoritmo
iterativo de Rohlf y Slice (1990) a menudo da resultados ligeramente diferentes desde el algoritmo directa de Dryden y Mardia (1998).
Pasado utiliza el antiguo con el fin de seguir el estndar de la industria.

Los datos faltantes se soporta pero slo por sustitucin promedio de la columna, que tal vez no es muy significativa.

referencias

Dryden, IL y KV Mardia 1998. Anlisis de la forma de Estadstica. Wiley.

Rohlf, FJ y Slice, D. 1990. Extensiones del mtodo Procrustes para la superposicin ptima de puntos de referencia. Zoologa
sistemtica 39: 40-59.

Seales, Bookstein ajustada

Bookstein accesorio tiene una funcin similar como Procrustes apropiado, sino simplemente estandariza tamao, rotacin y escala forzando los dos
primeros puntos de referencia en las coordenadas (0,0) y (1,0). No es de uso comn hoy en da. Bookstein apropiado slo se implementa para 2D.

Proyecto de espacio tangente AN NO EN EL PASADO 3

Despus de Procusto o Bookstein ajustada, algunos procedimientos estadsticos se llevaron a cabo idealmente en el espacio tangente
coordenadas proyectadas (por lo general no hace ninguna diferencia, pero no a citar en eso!). Con re el nmero de dimensiones y pag el
nmero de puntos de referencia, la proyeccin es

cc
t
XXIXX
dp
.

Aqu, x es el norte x dp matriz de norte especmenes, x 'Es la matriz de transformada, yo el dp x dp matriz de identidad, y x do la configuracin media
(consenso) como una dp- fila de elementos de vector.

22
Retire el tamao de puntos de referencia AN NO EN EL PASADO 3

El 'Eliminar el tamao de puntos de referencia' opcin en el men Transform le permite eliminar tamao dividiendo todos los valores de las
coordenadas del baricentro tamao de cada muestra (coordenadas Procrustes tambin se normalizan con respecto al tamao).

Ver Dryden y Mardia (1998), p. 23-26.

Referencia

Dryden, IL y KV Mardia 1998. Anlisis de la forma de Estadstica. Wiley.

transformar puntos de referencia

Permite la rotacin de la nube de puntos en pasos de 90 grados, y mover de un tirn de arriba a abajo o de izquierda a la derecha (mirroring),

principalmente para el trazado de conveniencia. La operacin de espejo puede ser til para reducir una seal de datos bilateralmente simtricas, por

Procrustes montar el medio izquierdo a una versin reflejada de la mitad derecha (y, opcionalmente, con un promedio de los dos).

Slo para coordenadas 2D.

regular la interpolacin

Interpola una serie de tiempo irregular muestreada o transecta (posiblemente multivariante) en un espaciamiento regular, como es requerido por

muchos mtodos para el anlisis de series de tiempo. los x valores deben estar en la primera columna seleccionada. Estos sern reemplazados por

una serie cada vez mayor regularidad. Todas las columnas seleccionadas adicionales se interpolan correspondientemente. Los peligros de la

interpolacin deben mantenerse en mente.

Puede especificar el nmero total de puntos interpolados, o el nuevo espaciado de puntos. Cuatro mtodos de interpolacin estn disponibles. La
interpolacin antialiasing utiliza una sinc 50 puntos (FIR) de filtro con una ventana de Hamming, filtrado de paso bajo en la mitad de la nueva
frecuencia de muestreo (promediada para el muestreo desigual) para reducir aliasing cuando baja el muestreo.

evaluar la expresin

Esta potente caracterstica permite operaciones matemticas flexibles en la matriz seleccionada de datos. Cada clula seleccionado se
evala, y el resultado sustituye el contenido anterior. Una expresin matemtica se debe introducir, lo que puede inlude cualquiera de los
operadores +, -, *, /, ^ (potencia), y MOD (mdulo). Tambin con el apoyo son parntesis (), y las funciones abs, atan, asin, cos, sin, EXP,
LN, sqrt, SQR, redondas y TRUNC.

Los siguientes valores se definen tambin:

x (el contenido de la celda actual)


l (la clula a la izquierda si es que existe, de lo contrario 0)

r (la celda a la derecha)


u (la clula anterior, o hacia arriba)

d (la clula abajo, o hacia abajo)

media (el valor medio de la columna actual)

23
min (el valor mnimo)
max (el valor mximo)
n (el nmero de clulas en la columna)
i (el ndice de la fila)

j (el ndice de columna)


aleatorio (nmero aleatorio uniforme de 0 a 1)
(Nmero aleatorio gaussiano con media 0 y varianza 1) normal.
integral (suma acumulada de la columna actual)
DESVEST (desviacin estndar de la columna actual)
suma (suma total de la columna actual)

Adems, otras columnas se pueden denominar con el nombre de la columna precedido por '%', por ejemplo% A.

Ejemplos:

sqrt (x) Reemplaza todos los nmeros con sus races cuadradas

(X-media) / STDEV Mean y normalizacin desviacin estndar, por columnas x-0.5 * (max + min) centros

de los valores en torno a cero (u + x + d) / 3

De tres puntos en movimiento suavizado promedio

xu diferencia de primer orden

Llena la columna con los nmeros de fila (requiere clulas no vacos, como todos ceros)
yo

sin (2 * 3,14159 * i / n) genera un perodo de una funcin sinusoidal de una columna (requiere no vaca
Clulas)

Nmero aleatorio de una distribucin normal, con una media de 10 y desviacin estndar de 5.
5 * normal de + 10

Faltan valores compatibles.

24
men Plot

Grafico

Parcelas de una o ms columnas en forma de grficos separados. los x coordenadas se ajustan automticamente a 1,2,3, ... Hay cinco estilos de

grfico disponibles: Grfico (lnea), los puntos, de acuerdo con los puntos, barras, y los tallos (lneas verticales). Las opciones '' Etiquetas de fila fija el x

etiquetas de los ejes a los nombres de las filas apropiadas.

El Log Y opcin log-transforma los valores de base 10. Para valores <= 0, el valor de registro se establece en 0.

La secuencia se puede alisar con una media mvil de 3 puntos.

Los valores perdidos se tienen en cuenta.

25
grfico XY

Parcelas uno o ms pares de columnas que contienen x / y pares de coordenadas. La opcin 'log Y' log-transforma sus valores de Y (cero o
valores negativos se establecen en 0). La curva tambin se puede alisar usando 3-punto de media mvil.

95% de concentracin elipses se pueden trazar en la mayora de los grficos de dispersin en el pasado, tales como calificaciones de PCA, CA,
DCA, PCO y NMDS. El clculo de estas elipses asume distribucin normal bivariante. Ellos estiman una regin donde se espera que el 95% de los
puntos de poblacin a caer, es decir, que no son regiones de confianza para la media.

cascos convexos tambin pueden ser dibujados en los grficos de dispersin, con el fin de mostrar las reas ocupadas por los puntos de diferentes

colores ''. El casco convexo es el polgono convexo ms pequeo que contiene todos los puntos.

El rbol de expansin mnima es el conjunto de lneas con una longitud total mnima, la conexin de todos los puntos. En el mdulo grfico XY, se

utilizan longitudes euclidianas en 2D.

Los puntos con los valores que faltan en X y / o Y se tienen en cuenta.

26
grfico XY con barras de error

Como grfico XY, pero espera cuatro columnas (o un mltiplo), con x, y, x error y valores de error y. barras de error simtricos se dibujan alrededor de
cada punto, con la mitad de ancho como se especifica. Si un valor de error se establece en cero o falta, la barra de error correspondiente no se dibuja.

Los puntos con los valores que faltan en X y / o Y se tienen en cuenta.

27
histograma

Parcelas histogramas de frecuencia (distribuciones) para una o ms columnas. El nmero de contenedores es por conjunto predeterminado a un nmero

"ptima" (la regla de fase cero de la varita 1997):

13
3.
marido min
49 s, 349
1.IQ n

dnde s es la desviacin estndar de la muestra y IQ el rango intercuartil.

El nmero de contenedores puede ser cambiado por el usuario. La opcin "Fit normal" dibuja un grfico con una distribucin ajustada normal
(estimacin paramtrica, no Mnimos Cuadrados).

Kernel Densidad Estimacin es un estimador suave del histograma. PASADO utiliza un kernel gaussiana con intervalo de acuerdo con la
regla dada por Silverman (1986):

15
0.
marido min 9 , IQ s1. 34 n .

Los valores perdidos se eliminan.

referencias

Silverman, BW 1986. estimacin de la densidad de la estadstica y anlisis de datos. Chapman & Hall.

Wand, MP 1997. basado-Data eleccin de anchura bin histograma. Americana estadstico 51: 59-64.

28
Grfico de barras / diagrama de cajas

Bar o diagrama de caja para una o varias columnas (muestras) de datos univariados. Alternativamente, puede utilizar una columna de grupo. Los

valores perdidos se eliminan.

Grfico de barras

Para cada muestra, el valor medio se muestra por una barra. Adems, bigotes opcionalmente pueden ser mostrados. El intervalo de whisker
puede representar un uno-sigma o un intervalo de confianza del 95% (1,96 sigma) para la estimacin de la media (basada en el error estndar),
o un intervalo de concentracin de una sola sigma o 95% (basado en la desviacin estndar) .

diagrama de cajas

Para cada muestra, los cuartiles 25-75 por ciento se dibujan utilizando una caja. La mediana se muestra con una lnea horizontal en el interior de
la caja. Los valores mnimos y mximos se muestran con lneas horizontales cortas ( "bigotes").

Si la casilla "Outliers" est marcada, se usa otra convencin diagrama de caja. Los bigotes se han extrado de la parte superior de la caja hasta el
punto de datos ms grande inferior a 1,5 veces la altura de la caja de la caja (la "valla interior superior"), y de manera similar por debajo de la caja. Los
valores fuera de las vallas interiores se muestran como crculos, los valores ms de 3 veces la altura de la caja de la caja (las "cercas exteriores") se
muestran como estrellas.

Los mtodos cuartil (redondeo o interpolacin) se describen en percentiles a continuacin.

parcela de fluctuacin

Cada valor se representa como un punto. Para mostrar puntos de solapamiento con mayor claridad, que pueden ser desplazadas mediante un aleatorio

con valor de jitter controlada por un control deslizante.

Grfico de barras diagrama de cajas

29
grfico de sectores

Traza un grfico de sectores simple o grfico de anillos de una sola columna de datos. Un sector se pueden valorizar con explosin:

grfico apilado

Uno o ms filas de datos se pueden representar como grfico de barras apiladas o un grfico de reas apiladas. Cada barra representa una fila, y los

datos a lo largo de las columnas se representan de forma acumulativa. La opcin de 'porcentaje' se convierte en porcentajes del total fila, de modo que

todas las barras sern de igual altura (100%).

30
Stacked grfico de rea con la opcin de porcentaje, ejes volteado

percentiles

Para cada percentil pag, traza el valor y de tal manera que pag por ciento de los puntos son ms pequeos que y. Se incluyen dos
mtodos populares. Para un percentil pag, el rango se calcula segn k = p (n + 1) / 100, y el valor que corresponde a ese rango tomado.
En el mtodo de redondeo, k se redondea al entero ms prximo, mientras que en el mtodo de interpolacin, filas no enteros son
manejados por interpolacin lineal entre las dos filas ms cercanas.

Los valores perdidos se eliminan.

31
grfico de probabilidad normal

Traza un grfico de probabilidad normal (QQ normal) para una columna de datos. Una distribucin normal trazar sobre una lnea recta. Para la
comparacin, se da una lnea de regresin RMA, junto con el coeficiente de probabilidad grfica de correlacin.

(Tres grupos se dan en este ejemplo)

Los valores perdidos se eliminan.

Las medianas normales orden de estadsticas se calculan como N (i) = G (U (i)), dnde GRAMO es la inversa de la funcin de distribucin
normal acumulativa y T son las medianas orden estadsticos uniformes:

U(1n ) , yo 1

U (i ) 0. Ni
0 3175. 2 365 , 3 , . . . Ni 1
1
Ni
norte

0. 5

32
Ternario

diagrama ternario de tres columnas de datos, que contiene normalmente proporciones de composiciones. Si se incluye una cuarta columna, se muestra el

uso de ya sea una representacin de burbujas o como un mapa de color / escala de grises.

se eliminan filas con valor faltante (s) en cualquier columna. Cuando se utiliza la opcin de mapa de color, las filas con la cuarta
variable que falte se incluyen en la trama, pero no contribuyen al mapa.

33
parcela de burbujas

Para representar datos en 3D (tres columnas) mostrando el tercer eje como el tamao de los discos. Los valores negativos no se muestran. Seleccione

"Restar min" para restar el valor ms pequeo tercer eje de todos los valores - Esto obligar a los datos a ser positivo. El control deslizante "Tamao"

escalas de las burbujas con relacin a radio unidad en la escala de eje x.

se eliminan filas con valor faltante (s) en cualquier columna.

34
dispersin 3D / parcela burbuja

Requiere tres o cuatro columnas de datos. Durante tres columnas, los datos se representan como esferas de tamao fijo con las coordenadas

xyz dadas. Una cuarta columna opcional se muestra como tamaos de burbujas. El sistema de coordenadas es diestro, con el eje z vertical

(positivo hacia arriba). Sticks se pueden aadir para enfatizar las posiciones en el plano xy.

35
parcela matriz

parcela de dos dimensiones de la matriz de datos, usando una escala de grises con el blanco para el valor ms bajo, negro para la ms alta, o una

escala de color. Incluye el contorno. Se utiliza para obtener una visin general sobre una matriz de datos de gran tamao. Los valores que faltan se

representan como espacios en blanco (que permiten agujeros y los lmites no cuadrados).

36
Superficie

parcela paisaje tridimensional de una matriz de datos de valores de elevacin. Los colores son asignados de acuerdo con la altura, y / o la
superficie puede ser sombreado en gris con un modelo de iluminacin. exageracin vertical es ajustable. Los valores perdidos son reemplazados
con el promedio. Los datos en el siguiente ejemplo son los mismos que para la trama matriz anterior.

37
parcela de mosaico

Muestra proporciones en una tabla de contingencia de dos vas o de tres vas como reas de rectngulos. Una tabla de dos vas se puede dar como una

matriz de datos simple o con dos columnas de grupo y una columna de datos nico (debe haber exactamente una fila para cada combinacin de niveles

de grupo). Los anchos de columna reflejarn totales de las columnas, y altos de fila reflejarn totales de fila. La interpretacin de una tabla de

contingencia de tres vas (especificado con tres columnas de grupo) es un poco ms complicado - ver ms abajo para el ejemplo estndar de Titanic,

por ejemplo, se describe en la pgina de Wikipedia sobre parcelas de mosaico.

38
men de estadsticas

univariado

Esta funcin calcula una serie de estadsticas descriptivas bsicas para una o ms muestras de datos univariados. Las muestras se pueden dar
en una o ms columnas separadas o con una columna de datos individual y una columna de grupo. Cada muestra debe tener al menos 3
valores. Las columnas pueden tener un nmero diferente de valores.

Los siguientes nmeros se muestran para cada muestra:

NORTE: El nmero de valores norte en la muestra

min: El valor mnimo

max: El valor mximo

Media: La estimacin de la media, calculada como


yo

nxx

Std. error: El error estndar de la estimacin de la media, calculada como

SE x
ns

39
dnde s es la estimacin de la desviacin estndar (vase a continuacin).

Diferencia: La varianza de la muestra, calculado como

1

2 2
yo

xxns
1 .

Estar. dev .: La desviacin estndar de la muestra, calculada como

1 2

1
yo
xxns

.

Mediana: La mediana de la muestra. por norte impar, el valor dado de tal manera que existen igualmente muchos valores
arriba y abajo. por norte incluso, la media de los dos valores centrales.

25 prcntil: el 25 percentil, es decir, el valor dado de tal manera que 25% de la muestra est por debajo de, 75% por encima. Se utiliza el

mtodo de interpolacin (vase la parcela Percentil arriba).

75 prcntil: el 75 percentil, es decir, el valor dado de tal manera que 75% de la muestra est por debajo de, 25% por encima. Se utiliza el

mtodo de interpolacin (vase la parcela Percentil arriba).

Oblicuidad: La asimetra de la muestra, de cero para una distribucin normal, positivo para una cola hacia la derecha. Calculado como

G
n xx 23

1
nn
3
(1 )( 2)
1

1
ii

XXII

.

Tenga en cuenta que hay varias versiones de este torno - Pasado utiliza la misma ecuacin que SPSS y Excel. Resultados

ligeramente diferentes pueden producirse usando otros programas, especialmente para los pequeos tamaos de muestra.

curtosis: La curtosis muestra, cero para una distribucin normal. Calculado como

xx
2
nn 1 norte
1
G
24

2
3
nnn
nn
2
4

3

1 3 21
1
ii

XXII

.

Una vez ms all utiliza la misma ecuacin que SPSS y Excel.

1/ nn

Geom. media: La media geomtrica, calculado como 21 xxx . Logaritmos se utilizan internamente.

Coeff.var: Coeficiente de variacin, o la relacin de la desviacin estndar de la media, en porcentaje:

1

2
CV yo

xxnxs
1
100 100
x

40
bootstrapping

Seleccin de bootstrapping calcular lmites inferior y superior para los intervalos de confianza del 95%, utilizando el nmero especificado de
repeticiones de arranque. Los intervalos de confianza para los valores mnimo y mximo no se les da, porque bootstrapping se sabe que no
funcionar bien para estas estadsticas. Tres mtodos de rutina de carga diferentes estn disponibles (cf. Davison y Hinkley 1997):

Sencillo (bsico):

La estadstica estimada a partir de la muestra original es t. Las estimaciones simuladas de R son repeticiones de arranque t 1 *, t 2 *, ..., t R *. Para
un IC del 95%, fijamos el error de una cola = 0,025. El simple (o bsico) bootstrap CI es entonces

2 *11
tt R
, 2 tt R
*1

.

Para asegurar subndices, valores de valores enteros para R tales como 999, 9999 o 99999 son convenientes.

percentil:

Una estimacin an ms simple:

* R 1,
*11
tt R
.

BCA (mtodo percentil ajustado):

Este es un mtodo complejo, pero un poco ms preciso que el bootstrap simple y percentil. Estimar un factor de correccin de
sesgo (llamado z en algunos textos):

1


r
*

ttw
,
R 1

dnde es la funcin normal acumulativa y | | es el nmero de elementos en el conjunto. Tenga en cuenta que utilizamos estrictamente menor que, a

diferencia de algunas fuentes. A continuacin, calcular un factor de correccin de la asimetra:

yo
tta


yo 1
3
,


norte
2 2

6 en
tt
yo 1

dnde t- yo se calcula la estadstica con un valor yo eliminado (jackknifed), y t es la media de la


jackknifed valores. Con estos valores para w y un, calcular los valores de punto final de CI ajustado

41
1. 96
1

wawwa
1 1 . 96

1. 96
2
,
1 1 . 96
wawwa

donde 1,96 es el cuantil aproximado para la distribucin normal que corresponde a un IC del 95% (el valor real utilizado es
1,959964). El intervalo de confianza bootstrap es

*1

1
, tt
RaR
*1
un2
.

No interpolacin se utiliza si el ndice no es un nmero entero.

Datos perdidos: Apoyado por eliminacin.

pruebas de una muestra

Las pruebas de si una muestra nica (single columna de datos) proviene de una poblacin con un dado, a menudo hipottico, media o mediana.

Por ejemplo, hay una serie de valores de los istopos de oxgeno a partir de conchas de mar (solo muestra) la misma que la composicin del

agua de mar promedio (media dada)? El valor de ensayo dado se debe escribir en. Adems, las pruebas de caso nico se utilizan para

comprobar si un nico valor proviene de la misma poblacin que la muestra dada.

De una muestra t prueba para la media dada 0 ( paramtrico)

Muestra de la media y la desviacin estndar se calcula como se describe anteriormente en estadsticas univariado. El intervalo de
confianza del 95% para la diferencia en las medias se basa en el error estndar para la estimacin de la media, y la t distribucin. Se
supone la distribucin Normal. Con s la estimacin de la desviacin estndar de la muestra, el intervalo de confianza es


, .
0 1
2, norte 0 1
2, norte
nstxnstx

Aqu, t tiene norte- 1 grados de libertad, y 1- = 0,95 para un intervalo de confianza del 95%.

los t prueba tiene hiptesis nula

MARIDO 0: Las muestras se toman de una poblacin con media 0.

La estadstica de prueba es

42

.
0

nsxt

De una muestra de prueba de Wilcoxon de rangos con signo de media dada M ( no paramtrica)

La prueba de Wilcoxon de una muestra tiene hiptesis nula

MARIDO 0: La muestra es tomada de una poblacin con mediana METRO.

Todos los valores son iguales a METRO se eliminan primero por el programa. A continuacin, los valores absolutos de las diferencias | re i | se clasifican ( R yo),

con rangos medios asignados para los lazos. La suma de filas de parejas donde re yo es positivo es W +. La suma de filas de parejas donde re yo es negativo

es W-. La estadstica de prueba es reportado

W = max ( W +, W-)

(Tenga en cuenta que hay varias otras versiones, el equivalente de esta prueba, la presentacin de informes de otras estadsticas).

Para grande n ( decir n> 10), la muestra grande aproximacin a pag puede ser usado. Esto depende de la distribucin normal de la estadstica de
prueba W:

nn 1 ( )
WE
( )
4


3
W Var ffnnn
gg
21 1 gramo

24 48 .

El ltimo trmino es una correccin para corbatas, donde F gramo es el nmero de elementos de lazo gramo. La resultante z se inform, junto con
el pag valor.

por n < 13, una exacta pag valor se calcula, por enumeracin completa de todas las reasignaciones posibles (hay 2 norte de ellos, es decir,
4096 para n = 12). Este es el preferido pag valor, si est disponible.

pruebas de caso nico

Las pruebas de caso nico tienen hiptesis nula

MARIDO 0: El nico valor dado y se toma de la misma poblacin que la muestra dada.

Se supone la distribucin Normal. Un simple z Se suele utilizar para este propsito, y tambin es proporcionada por el pasado. sin embargo, el z prueba

es inexacta porque se supone que la media y las desviaciones estndar se dan exactamente, mientras que en realidad se estimaron a partir de

la muestra. Por lo tanto, Past tambin proporciona un modificado t prueba (Sokal y Rohlf 1995; Crawford & Howell 1998):

43
xyt

1
NNS

con s la desviacin estndar de la muestra y norte- 1 grados de libertad.

referencias:

Crawford, JR & Howell, DC 1998. La comparacin de calificacin de la prueba de un individuo contra de las normas derivadas de muestras pequeas.

El neuropsiclogo clnico 12: 482-486.

Sokal, RR y Rohlf, JF 1995. Biometra. WH Freeman, San Francisco.

44
pruebas de dos muestras

Un nmero de la estadstica clsica y ensayos para la comparacin de dos muestras univariados, como se da en dos columnas. Tambin es
posible especificar los dos grupos utilizando una nica columna de valores y una columna Grupo adicional. se tienen en cuenta los datos que
faltan.

t pruebas de ensayo y relacionados sobre medias iguales

estadsticas de la muestra

Medias y varianzas se estiman como se describe ms arriba en las estadsticas univariantes. El intervalo de confianza 95% para la
media se basa en el error estndar para la estimacin de la media, y la t distribucin. Se supone la distribucin Normal. Con s la
estimacin de la desviacin estndar, el intervalo de confianza es


1
2, norte
, 1
2, norte
nstxnstx
.

Aqu, t tiene norte- 1 grados de libertad, y 1- = 0,95 para un intervalo de confianza del 95%.

El intervalo de confianza 95% para la diferencia entre los medios acepta tamaos de muestra desiguales:

2, df D
, 2,

styxstyx
df D
,

45
dnde

2 2
yo

SSE yo
yyxx

df
1
1nn2 1

SSE MSE
/ df

2

marido
1 1
1 nnn
2

2

re s
n MSE
marido
.

El intervalo de confianza se calcula para la media ms grande menos la ms pequea, es decir, el centro de la CI debe ser siempre

positivo. El intervalo de confianza para la diferencia de medios tambin se estima por arranque (arranque sencilla), con el nmero

dado de repeticiones (por defecto 9999).

t prueba

los t prueba tiene hiptesis nula

MARIDO 0: Las dos muestras se toman de las poblaciones con medias iguales.

los t prueba supone una distribucin normal y la igualdad de varianzas.

Desde el error estndar s re de la diferencia de los medios dada anteriormente, la estadstica de prueba es

YXT

s re .

varianza desigual t prueba

La desigualdad de la varianza t prueba tambin se conoce como la prueba de Welch. Se puede utilizar como una alternativa a la bsica t prueba cuando las

variaciones son muy diferentes, aunque se puede argumentar que las pruebas de diferencia en los medios en este caso es cuestionable. La estadstica

de prueba es

yx
t
var ( ) var ( ) nynx
1 2 .

El nmero de grados de libertad es

46
2
var ( x ) var ( y )

norte
1
norte
2
df 2 2
var ( ) nx1 Var (1 )York
Nueva

2

1

norte norte
2
1 .

prueba de permutacin de Monte Carlo

La prueba de permutacin para la igualdad de medias utiliza la diferencia absoluta en medios como estadstica de prueba. Esto es
equivalente a usar la t estadstica. La prueba de permutacin es no paramtrico con algunas suposiciones, pero las dos muestras se supone
que es igual en la distribucin si la hiptesis nula es verdadera. El nmero de permutaciones se puede ajustar por el usuario. La potencia de
la prueba est limitada por el tamao de la muestra - en el significado p < 0,05 nivel slo puede lograrse para n> 3 en cada muestra.

prueba de permutacin exacta

A medida que el Monte Carlo permutacin de prueba, pero todas las permutaciones posibles se calculan. Slo est disponible si la suma de los dos

tamaos de muestra es inferior a 27.

F prueba para varianzas iguales

47
los F prueba tiene hiptesis nula

MARIDO 0: Las dos muestras se toman de las poblaciones con la misma varianza.

Se supone la distribucin Normal. los F estadstica es la proporcin de la varianza ms grande a la ms pequea. La significacin es de dos
colas, con norte 1 y norte 2 grados de libertad.

Monte Carlo y permutacin pruebas exactas sobre la F estadstica se calcula como para el t prueba anterior.

prueba de Mann-Whitney para la igualdad de las medianas

El de dos colas (Wilcoxon) Mann-Whitney T prueba se puede utilizar para probar si las medianas de dos muestras
independientes son diferentes. Es una prueba no paramtrica y no asume distribucin normal, pero hace asumir distribucin
en forma igual en ambos grupos. La hiptesis nula es

MARIDO 0: Las dos muestras se toman de las poblaciones con igualdad de medianas.

Para cada valor en la muestra 1, contar el nmero de valores en la muestra 2 que son ms pequeas de lo que (lazos cuentan 0,5). El total
de estos aspectos es la estadstica de prueba T ( aveces llamado T). Si el valor de T es menor cuando invirtiendo el orden de las muestras, se
elige este valor en vez (se puede demostrar que
T 1+ T 2 = norte 1 norte 2).

El programa calcula una aproximacin asinttica a pag basado en la distribucin normal (de dos colas), que slo es vlido para gran norte.
Incluye una correccin de continuidad y una correccin para las relaciones:

48
Uz nn 0 2. 5

1 2



3
ffnnnn
3
21
gg

gramo
12
nn 1

dnde n = n 1+ norte 2 y F gramo es el nmero de elementos de lazo gramo.

tambin se da un valor Monte Carlo basado en el nmero dado de permutaciones aleatorias (por defecto 9999)
- el propsito de esto es principalmente como un control en el valor asinttico.

por norte 1+ norte 2 <= 30 (por ejemplo, 15 valores en cada grupo), una exacta pag Se da valor, basado en todas las posibles asignaciones de grupo. Si

est disponible, use siempre este valor exacto. Para muestras ms grandes, la aproximacin asinttica es bastante precisa.

prueba de la mediana del estado de nimo por la igualdad de las medianas

La prueba de la mediana es una alternativa a la prueba de Mann-Whitney para la igualdad de las medianas. La prueba de la mediana tiene baja potencia,

y por lo tanto la prueba de Mann-Whitney es generalmente preferible. Sin embargo, puede haber casos con valores atpicos fuertes en la prueba del

estado de nimo puede funcionar mejor.

La prueba simplemente cuenta el nmero de valores en cada muestra que estn por encima o por debajo de la mediana agrupada, la produccin
de una tabla de contingencia 2x2 que se prueba con una prueba estndar de ji cuadrado con dos grados de libertad, sin correccin de Yate.

prueba de Kolmogorov-Smirnov para distribuciones iguales

La prueba de Kolmogorov-Smirnov es una prueba no paramtrica para su distribucin igual en general de dos muestras univariados. En otras
palabras, no prueba especficamente para la igualdad de la media, la varianza o cualquier otro parmetro. La hiptesis nula es H 0: Las dos
muestras se toman de las poblaciones con la misma distribucin.

49
En la versin de la prueba proporcionada por el pasado, las dos columnas deben representar las muestras. No se puede probar una muestra en contra de

una distribucin terica (prueba de una muestra).

La estadstica de prueba es la diferencia absoluta mxima entre las dos funciones de distribucin acumulativa empricas:

mx N x1
x SD
S norte
x
2

El algoritmo se basa en Press et al. (1992), con significacin estimado despus de Stephens (1970). Definir la funcin




2 2
1 2 jj
Q
Kansas
2 1 mi
j1 .

Con norte e = norte 1 norte 2 / ( norte 1+ norte 2), el significado se calcula como


pKansas NQmi .0 0 12. 11 mi
DN.

La prueba de permutacin utiliza 10.000 permutaciones. Utilice la permutacin pag valor por N < 30 (o en general).

referencias

Press, WH, Teukolsky, SA, Vetterling, WT y Flannery, BP 1992. Numerical Recipes en C. 2 Dakota del Norte
edicin. Prensa de la Universidad de Cambridge.

Stephens, MA 1970. El uso de la prueba de Kolmogorov-Smirnov, Cramer-von Mises y estadsticas relacionadas sin tablas
extensas. Revista de la Sociedad Real de Estadstica, Serie B 32: 115-122.

50
Coeficiente de variacin (test Fligner-Kileen)

pruebas Este mdulo para la igualdad de coeficiente de variacin en dos muestras.

El coeficiente de variacin (o variacin relativa) se define como la relacin de desviacin estndar de la media en porcentaje, y se
calcula como:

1

2
CV yo

xxnxs
1
100 100
x .

Los intervalos de confianza del 95% se calculan por bootstrapping (bootstrap simple), con el nmero dado de repeticiones (por
defecto 9999).

La hiptesis nula si la prueba estadstica es:

MARIDO 0: Las muestras se tomaron a partir de poblaciones con el mismo coeficiente de variacin.

Si el dado pag( normal) es menor que 0,05, igual coeficiente de variacin puede ser rechazada. Donnelly y Kramer (1999) describen el
coeficiente de variacin y revisar un nmero de pruebas estadsticas para la comparacin de dos muestras. Ellos recomiendan la
prueba Fligner-Killeen (Killeen Fligner y 1976), como se aplica en el pasado. Esta prueba es a la vez potente y es relativamente
insensible a la distribucin. Se presentan los siguientes estadsticas:

51
T: La estadstica de prueba Fligner-Killeen, que es una suma de las posiciones clasificados transformadas de la muestra ms pequea

dentro de la muestra combinada (vase Donnelly & Kramer 1999 para ms detalles).

E (T): El valor esperado para T.

z: La estadstica z, basado en T, var ( T) y E ( T). Tenga en cuenta que esto es una aproximacin a gran muestra.

pag: los pag( MARIDO 0) valor. Ambos se dan los valores de una cola y dos colas. Para la hiptesis alternativa de la diferencia en cualquier
direccin, el valor de dos colas se debe utilizar. Sin embargo, la prueba Fligner-Killeen se ha utilizado para comparar la variacin
dentro de una muestra de fsiles con la variacin dentro de una especie estrechamente relacionada moderna, para la prueba de
mltiples especies fsiles (Donnelly y Kramer 1999). En este caso, la hiptesis alternativa podra ser que CV es mayor en la poblacin
fsil, si es as, una prueba de una cola se puede utilizar para aumentar la potencia.

La captura de pantalla anterior reproduce el ejemplo de Donnelly y Kramer (1999), que muestra que la variacin relativa dentro de Australopithecus
afarensis es significativamente mayor que en Gorilla gorilla. Esto podra indicar que A. afarensis representa varias especies.

referencias

Donnelly, SM & Kramer, A. 1999. Las pruebas para mltiples especies en muestras fsiles: Una evaluacin y comparacin de las pruebas
para la variacin relativa igual. American Journal of Physical Anthropology 108: 507-
529.

Fligner, MA y Killeen, TJ 1976. Distribucin libres de dos pruebas de muestra para la escala. Revista de la Asociacin Americana de Estadstica 71:
210-213.

F y t pruebas de parmetros

A veces, las publicaciones no dan los datos, pero los valores para el tamao muestral, media y la varianza de dos muestras. Estos pueden
introducirse manualmente utilizando la 'F y t desde parmetros' opcin en el men. Este mdulo no utiliza ningn tipo de datos de la hoja de
clculo.

52
Dos muestras pares de pruebas ( t, firmar, Wilcoxon)

Tres pruebas estadsticas (uno paramtricos, dos no paramtrico) para dos muestras (columnas) de datos univariados. Los puntos de datos
estn emparejados, lo que significa que los dos valores en cada fila estn asociados. Por ejemplo, la prueba podra ser la de longitud de la
izquierda contra el brazo derecho en un nmero de personas, o la diversidad en verano vs invierno en varios sitios. El control de un factor de
molestia (persona, lugar) de esta manera aumenta la potencia de la prueba. La hiptesis nula es:

MARIDO 0: El significado ( t test) o mediana (prueba de los signos, prueba de Wilcoxon) de la diferencia es cero.

Todo lo reportado pag los valores son de dos colas.

t prueba

Las pruebas para la diferencia media igual a cero mediante la sola muestra patrn t prueba en las diferencias. Con re i = x yo- y yo , tenemos

1 2

1
yo

DDNS
,

NSDT
.

Existen norte- 1 grados de libertad. Esta prueba supone la distribucin normal de las diferencias.

53
La versin exacta de la prueba calcula todas las posibles reasignaciones de grupo dentro de pares. Slo se calcula por menos de
26 pares.

prueba de los signos

La prueba de los signos (binomio) simplemente cuenta el nmero de casos norte 1 dnde x i> y yo y norte 2 dnde y i> x yo. El nmero max ( norte 1, norte 2) esta

reportado. los pag valor es exacta, calculada a partir de la distribucin binomial. La prueba de los signos puede tener una energa ms baja que los otros

pares de pruebas, pero hace algunas suposiciones.

Prueba de Wilcoxon

Una prueba de rangos no paramtrica que no asume una distribucin normal. La hiptesis nula es sin cambio de medio (sin
diferencia).

Todas las filas con la diferencia cero se eliminan por primera vez por el programa. A continuacin, los valores absolutos de las diferencias | re i | se

clasifican ( R yo), con rangos medios asignados para los lazos. La suma de filas de parejas donde

re yo es positivo es W +. La suma de filas de parejas donde re yo es negativo es W-. La estadstica de prueba es reportado

W = max ( W +, W-)

(Tenga en cuenta que hay varias otras versiones, el equivalente de esta prueba, la presentacin de informes de otras estadsticas).

Para grande n ( decir n> 10), la muestra grande aproximacin a pag puede ser usado. Esto depende de la distribucin normal de la estadstica de
prueba W:

nn 1 ( )
WE
( )
4


3
W Var ffnnn
gg
21 1 gramo

24 48 .

El ltimo trmino es una correccin para corbatas, donde F gramo es el nmero de elementos de lazo gramo. La resultante z se inform, junto con
el pag valor.

El valor de significacin Monte Carlo se basa en 99.999 reasignaciones al azar de valores a columnas, dentro de cada par. Este
valor ser prcticamente idntica a la exacta pag valor.

por n < 26, una exacta pag valor se calcula, por enumeracin completa de todas las reasignaciones posibles (hay 2 norte de ellos, es decir,
ms de 33 millones para n = 25). Este es el preferido pag valor, si est disponible.

Datos perdidos: Apoyado por la eliminacin de la fila.

54
pruebas Varios de muestras

ANOVA y Kruskal-Wallis pruebas de un solo sentido para la igualdad de medias o medianas entre varias muestras univariados, dados en
columnas separadas. Tambin es posible especificar los grupos usando una sola columna de valores y una columna Grupo adicional. Los
datos que faltan son apoyados por eliminacin.

ANOVA de una va

ANOVA de una va (anlisis de varianza) es un procedimiento estadstico para probar la hiptesis nula de que varias muestras univariantes

se toman de las poblaciones con la misma media. Las muestras se supone que estar cerca de una distribucin normal y tienen variaciones

similares. Si los tamaos de las muestras son iguales, estas dos hiptesis no son crticos. Si las suposiciones estn fuertemente violados, el

test no paramtrico de Kruskal-Wallis se debe utilizar en su lugar.

tabla de ANOVA

La suma entre grupos de cuadrados est dada por:


2
SS bg
gg
XXII
T

gramo
,

dnde norte gramo es el tamao de grupo gramo, y los medios son el grupo y los medios totales. La suma entre grupos de cuadrados tiene un
df asociado bg, el nmero de grupos menos uno.

55
La suma intra-grupos de cuadrados es


2
SS WG
americano
xxsoldado
gramo yo

donde el x yo son aquellos en el grupo gramo. La suma de los grupos dentro de la plaza tiene un asociado df WG, el nmero total de valores
menos el nmero de grupos.

Los cuadrados medios entre y dentro de los grupos se dan por

SS MS
dfbg bg
bg

wg
WG SS MS
df wg

Por ltimo, la estadstica de prueba F se calcula como

MS bg
F
MS WG

los pag valor se basa en F con df bg y DF WG grados de libertad.

Omega cuadrado

El omega cuadrado es una medida del tamao del efecto, que vara de 0 a 1:

bg bg 2
df SS MS wg
.
SS MS
total WG

A partir de esta ecuacin, el valor puede ser negativo. Se fuerza a cero en estos casos.

el test de Levene

el test de Levene para la homogeneidad de la varianza (homocedasticidad), es decir, si las variaciones son iguales como se supone por ANOVA,
tambin se da. Se incluyen dos versiones de la prueba. El test de Levene original se basa en medios. Esta versin tiene ms poder si las
distribuciones son normales o al menos simtrica. La versin basada en las medianas tiene menos potencia, pero es ms robusto a las
distribuciones no normales. Tenga en cuenta que esta prueba se puede utilizar tambin para slo dos muestras, dando una alternativa a la F prueba
para dos muestras descritas anteriormente.

Varianzas desiguales (Welch) ANOVA

Si el test de Levene es significativa, lo que significa que usted tiene varianzas desiguales, puede utilizar la versin unequalvariance
(Welch) de ANOVA, con el F, DF y pag valores dados.

56
Anlisis de los residuos

La pestaa residuales muestra las propiedades de los residuos, con el fin de evaluar algunos supuestos del ANOVA como la
distribucin normal y homoscedsticos de los residuos.

Se da la prueba de Shapiro-Wilk para la distribucin normal, junto con varias parcelas comunes de residuos (de probabilidad
normal, residuos vs. medias de los grupos, y el histograma).

pruebas post-hoc de Tukey pairwise

Si el ANOVA muestra la desigualdad significativa de los medios (pequea pag), se puede ir a estudiar la tabla dada de comparaciones por
pares "post-hoc", en base a la prueba de Tukey-Kramer. La gama de Estadstica Studentized Q se da en el tringulo inferior izquierda de la
matriz, y las probabilidades p (igual) en la parte superior derecha.

SL
,
SRA WG
XXQ
n

dnde x L es la ms grande y x S la media ms pequea de las dos muestras que se comparan. Si los tamaos de las muestras no son iguales,
la media armnica se utiliza para norte. Su importancia se calcula de acuerdo a Lund y Lund (1983), con df WG grados de libertad.

57
Kruskal-Wallis

La prueba de Kruskal-Wallis es un ANOVA no paramtrico, la comparacin de las medianas de varios grupos univariados (dado en

columnas). Tambin puede considerarse como una extensin de varios grupos de la prueba de Mann-Whitney (Zar 1996). No asume

distribucin normal, pero no compromete la distribucin en forma de igual para todos los grupos. La hiptesis nula es

MARIDO 0: Las muestras se toman a partir de poblaciones con igualdad de medianas.

La estadstica de prueba MARIDO se calcula como sigue:

2

nn H
1 (12
T 3
nn 1
) gramo
gg
,

dnde norte gramo es el nmero de elementos en el grupo g, n es el nmero total de elementos, y T gramo es la suma de rangos en el grupo gramo.

La estadstica de prueba MARIDO do se ajusta para los lazos:

,
HH
do
ssii

1
yo

nn
33

dnde F yo es el nmero de elementos de lazo yo.

58
Con GRAMO el nmero de grupos, las pag valor se aproxima a partir MARIDO do utilizando la distribucin chi-cuadrada con GRAMO- 1 grados de libertad.

Esto es menos precisa si los hay norte g < 5.

pairwise pruebas post-hoc de Mann-Whitney

prueba de pares de Mann-Whitney pag los valores se dan para todos norte p = G (G- 1) / 2 pares de grupos. Se utiliza la aproximacin asinttica se
describe en el mdulo de Mann-Whitney. Si las muestras son muy pequeas, puede ser til ejecutar la prueba exacta disponible en ese mdulo
en su lugar.

Cuatro puntos de vista diferentes estn disponibles para la tabla simtrica:

1. Crudo pag los valores, la significacin no corregido: La pag valores de cada prueba pairwise individual,
marcada en color rosa si p < 0,05, no se corrige para mltiples pruebas.

2. Crudo pag valores, secuencial de Bonferroni importancia: La pag valores de cada pairwise individuo
la prueba se muestran sin corregir para mltiples pruebas. Significacin (marca rosa) se evala mediante la evaluacin de primero la ms

pequea pag valor, con la correccin de Bonferroni para norte pag pares. Si significativa ( pN p < 0,05) la siguiente ms pequea pag valor es

significativo si p (N pag- 1) <0,05, etc.

3. Bonferroni corregido pag valores: Los valores mostrados son pag '= pN pag. Marcado como significativo si

pag '<0,05.

4. Mann-Whitney T: Las estadsticas de prueba.

post-hoc de Dunn

test post hoc de Dunn (Dunn 1964) es una prueba pairwise llevado a cabo a menudo despus de una prueba KruskalWallis significativo. Es una
alternativa a la de pares de Mann-Whitney.

Con T gramo la suma de rangos dentro del grupo gramo de la prueba de Kruskal-Wallis, calcular para cada grupo el rango promedio:

.
TT
n ggg

Para comparar los dos grupos A y B, calcular el z estadstica

en Letras
TTlicenciado
z
AB
,
AB

dnde


3
FFNN
1
ii
1
1 1 12 12
.
yo


AB

A
nnn
b

Aqu, norte es el tamao total de la muestra y F yo el nmero de elementos de lazo yo, como en la prueba de Kruskal-Wallis.

59
Ver pares de Mann-Whitney anteriormente para las diversas opciones en la mesa de salida (en bruto pag valores, crudo pag

valores con secuencial de Bonferroni, Bonferroni corregido pag valores, y el z estadstica).

referencias

Dunn, 1964. DO mltiples comparaciones utilizando sumas de rangos. Technometrics 6: 241-252.

Lund, RE, Lund, JR 1983. Algoritmo de AS 190: Probabilidades y cuantiles superiores para la gama de Student. Diario de la Royal
Statistical Sociedad C 32: 204-210.

Zar, JH 1996. anlisis bioestadstico. 3 rd ed. Prentice Hall.

60
Varios-muestras repetidas pruebas de medidas

En ANOVA de medidas repetidas, los valores de cada fila son observaciones sobre el mismo sujeto. Medidas repetidas ANOVA es la
extensin de la emparejado t de prueba para varias muestras. Cada columna (muestra) debe contener el mismo nmero de valores.

Los valores perdidos no son compatibles.

El procedimiento comienza como las muestras independientes de una va ANOVA anteriores. En breve,


2
SS g XXII ,
bg T

gramo

dnde norte es el tamao de la muestra. La df asociado bg es el nmero de grupos de menos uno.


2
SS WG
americano
xxsoldado
gramo yo

donde el x yo son aquellos en el grupo gramo. La df asociado WG es el nmero total de valores menos el nmero de grupos.

La suma entre sujetos de cuadrados es


2
SS sub
XXII
Ti
,
yo

61
donde el yo x son medios de sujeto yo grupos de todo. La df asociado sub es el nmero de sujetos menos uno.

el SS error es simplemente SS WG - SS sub, con df error = df WG - df sub.

Los cuadrados medios son entonces las suma de cuadrados divididos por sus respectivos grados de libertad:

SS MS
dfbg bg
bg

wg
WG SS MS
df wg

sub
sub SS MS
df sub

error
.
error SS MS
df error

Finalmente, el F relacin es MS bg / SRA error, con df bg y DF error grados de libertad.

pruebas post-hoc de Tukey pairwise

Las comparaciones por pares "post-hoc" se basan en la prueba de Tukey. La gama de Estadstica Studentized Q
se da en el tringulo inferior izquierda de la matriz, y las probabilidades p (igual) en la parte superior derecha.

SL
,
SRA error
XXQ
n

dnde x L es la ms grande y x S la media ms pequea de las dos muestras que se comparan. Hay df error

grados de libertad.

test de Friedman

La prueba de Friedman es una prueba no paramtrica para la igualdad de medianas en varios grupos de medidas repetidas univariantes.

Puede ser considerado como la versin no paramtrico de ANOVA de medidas repetidas, o la versin de mediciones repetidas de la prueba de

Kruskal-Wallis.

62
La prueba de Friedman sigue Bortz et al. (2000). La estadstica de prueba es bsica


2
kn1 (3 ) ,
2

1 (12T k nk j
) j1

dnde norte son el nmero de filas, k el nmero de columnas y T j las sumas de columna de la tabla de datos.

los 2 valor se corrige a continuacin para los lazos (si existe):

2
2

Corbata metro

nk
1 12 1
3 TTK
ii

yo 1

dnde metro es el nmero total de grupos de unin y t yo es el nmero de valores en cada grupo empate.

por k = 2, se recomienda utilizar uno de los pares de pruebas (por ejemplo, la muestra o prueba de Wilcoxon) en lugar. Para los pequeos conjuntos de

datos donde k = 3 y n < 10, o k = 4 y n < 8, el tie-corregido 2 valor se busca en una tabla de exacta pag valores. Cuando se administra, este es el preferido pag

valor.

el asinttica pag valor (utilizando el 2 con la distribucin k- 1 grados de libertad) es bastante preciso para grandes conjuntos de datos. Se

calcula a partir de una versin corregida de la continuidad 2:

2
k
TS kn 1
j

2

j 1


kN S
22
1 12
.
3

kkn 24 1

63
Esta 2 valor tambin se corrige para los lazos utilizando la ecuacin anterior.

Las pruebas post hoc son por simple Wilcoxon por parejas, exacta para n < 20, asinttica para n> = 20. Estas pruebas tienen una potencia mayor que la

prueba de Friedman.

Referencia

Bortz, J., Lienert, GA y Boehnke, K. 2000. Verteilungsfreie Methoden in der Biostatistik. 2 ed. Saltador.

64
ANOVA de dos vas

ANOVA de dos vas (anlisis de varianza) pone a prueba la hiptesis nula de que varias muestras univariados tienen la misma media a travs
de cada uno de dos factores A y B, y que no hay dependencias (interacciones) entre factores. Las muestras se supone que estar cerca de una
distribucin normal y tienen variaciones similares. Si los tamaos de las muestras son iguales, estas dos hiptesis no son crticos. La prueba
supone un diseo de factor fijo (el caso habitual). Tambin hay una opcin para anidados ANOVA de dos vas. No hay ningn trmino de
interaccin para este diseo.

Se necesitan tres columnas: una columna de grupo (set tipo de datos a Grupo con 'Columna atributos') con los niveles de factor A, una
columna de grupo con los niveles de factor B, y una columna de los valores medidos correspondientes.

El algoritmo utiliza medios ponderados de los diseos no balanceados.

suma total de cuadrados:


2
SS T
yo
xx ,
yo

asumido todos los puntos. Los asociados grados de libertad df T es el nmero total de valores menos uno.

suma dentro de los grupos de cuadrados:


2
SS xx ,
WG ggi
1 2

gg1 2
yo

sesenta y cinco
donde el x yo son aquellos en el grupo (nivel) gramo 1 para el primer factor y gramo 2 para el segundo factor, y la media se toma dentro de la
misma combinacin de grupo. La df asociado WG es el nmero total de valores menos el producto de los nmeros de grupos y columnas.

La suma entre grupos de cuadrados SS bg = SS T - SS WG se puede dividir en tres, a saber el Factor A, Factor B y trminos
de interaccin.


2
SS UN
a

N I
xx ,
yo

donde la suma es sobre los niveles de Factor A, y los dos medios son la media nivel y la media total, respectivamente. norte UN es el nmero de
niveles de A. Los grados de libertad se df A = norte UN - 1. Del mismo modo, para el Factor B:

N xx
2
SS
segundo segundo j
j

donde ahora la suma es sobre los niveles del factor B. Los grados de libertad es df B = norte segundo - 1.

La suma de cuadrados interaccin es SS A x B = SS bg - SS UN - SS SEGUNDO, con df AxB = ( norte UN - 1) ( norte B - 1) grados de libertad.

Cuadrados medios MS son la suma de los cuadrados divididos por sus respectivos grados de libertad.

Finalmente, el F relaciones son

F A = SRA UN / SRA WG

F B = SRA B / SRA WG

F A x B = SRA A x B / SRA WG

los grfico de medios es un dispositivo grfico simple, tradicionalmente utilizado para ver los efectos de factores y su interaccin para un ANOVA
de dos vas. Los medios se muestran con cualquiera de los niveles A o los niveles de B sobre el eje X, y los otros niveles como lneas separadas:

66
pruebas post-hoc de Tukey

pruebas post-hoc de Tukey estn disponibles para los dos factores principales, y para todas las interacciones sin factores de confusin. Para los factores

principales, la Cordillera de Estadstica Studentized Q se da en el tringulo inferior izquierda de la matriz, y las probabilidades p (igual) en la parte superior

derecha. El ensayo de interaccin utiliza el valor k ajustado, que representa el nmero de comparaciones sin factores de confusin, para un mximo de 7

niveles en cada factor. Para mayor nmero de niveles no se ajusta el valor de k.

Valores faltantes : se eliminan las filas con valores perdidos.

67
ANOVA de dos vas sin replicacin

ANOVA de dos vas para probar la hiptesis nula de que varias muestras univariados tienen la misma media en cada uno de dos factores. Este mdulo

slo espera una observacin para cada combinacin de niveles para los dos factores. El formato de los datos de entrada es una tabla en la que los

primeros niveles de los factores entran en filas, y el segundo nivel de factor de columnas, por ejemplo, una tabla de resultados de laboratorio veterinario:

No hay trmino de interaccin.

Las ecuaciones estn dadas por Irlanda (2010), pp. 130-131.

Referencia

Irlanda, CR 2010. Estadsticas experimentales para la agricultura y horticultura. CABI, 352 pp.

68
De dos vas ANOVA de medidas repetidas

Se necesitan tres columnas de datos: Una columna grupo (set tipo de datos a Grupo con 'Columna atributos') con los niveles de factor A,

una columna de grupo con los niveles de factor B, una columna de grupo con los identificadores para los casos (sujetos) y una columna de

los valores medidos correspondientes.

Cada sujeto debe tener exactamente una entrada para cada combinacin de niveles. Por lo tanto, si usted tiene METRO

niveles para el factor A, norte los niveles de factor B y S los sujetos, se necesitan exactamente METRO x norte x S filas en total.

Otra funcionalidad es similar al mdulo de ANOVA de dos vas se ha descrito anteriormente.

Los datos que faltan no son compatibles!

69
Unidireccional ANCOVA

ANCOVA (anlisis de covarianza) pruebas para la igualdad de medias para varios grupos univariados, ajustados por covarianza con otra
variable aleatoria. ANCOVA se puede comparar con ANOVA, pero tiene la caracterstica aadida de que para cada grupo, la varianza que
puede ser explicado por una covariable "molestia" especificado ( x) es removido. Este ajuste puede aumentar la potencia de la prueba
sustancialmente.

El programa espera dos o ms pares de columnas, donde cada par (grupo) es un conjunto de correlacionado xy
de datos (medios se comparan para Y, mientras x es la covarianza). El ejemplo siguiente utiliza tres pares (grupos) a, b y c.

La pestaa Grfico presenta un grfico de dispersin y lneas de regresin lineal para todos los grupos. La tabla de resumen ANOVA-como contiene
de suma de cuadrados, etc., para los medios ajustados (entre grupos efecto) y error ajustado (dentro-grupos), junto con una F prueba para las medias
ajustadas. Un F Tambin se da prueba para la igualdad de las pendientes de regresin (como se supone por la ANCOVA). En el ejemplo, la igualdad
de medias ajustadas en los tres grupos pueden ser rechazados en p < 0.05. La igualdad de las pendientes no puede ser rechazada ( p = 0,74).

La pestaa Grupos da las estadsticas de resumen para cada grupo (media, media ajustada y pendiente de regresin).

Supuestos incluyen pendientes similares de regresin lineal para todos los grupos, las distribuciones normales, similar desviacin y tamaos de

muestra.

datos que faltan: xy pares, ya sea con x o y perdidos se descartan.


70
tabla de correspondencias

Se requieren dos o ms columnas. Una matriz se presenta con las correlaciones entre todos los pares de columnas. En el formato de tabla '\
p Estadstica (no corregible)', valores de correlacin se dan en el tringulo inferior de la matriz, y los dos de cola probabilidades de que las
columnas no estn correlacionados se dan en la parte superior. Ambos coeficientes y pruebas paramtricas y no paramtricas estn
disponibles.

Datos perdidos: Apoyado por eliminacin de pares, a excepcin de correlacin parcial que utiliza valor imputacin media.

Linear r (Pearson)

Pearson r es el coeficiente de correlacin paramtrica ms comnmente utilizado. Viene dada por

ii
yyxxr

.


2 2
ii
yo
yyxx

yo

La significacin se calcula utilizando una de dos colas t prueba con norte- 2 grados de libertad y

2
2
.
1 RNRT

D y rs de Spearman

(No paramtrico) coeficiente de correlacin de orden de rango de Spearman es el coeficiente de correlacin lineal (Pearson de r) de las
filas. Siguiendo Press et al. (1992) que se calcula como

71
1
ggff D 3

3
NNR
3
61 12 1
kk
12
mm
k metro
s
.

ffkk
ggmm

k
1 1
metro

33 33

nn nn

Aqu, re es la suma al cuadrado diferencia de rangos (midranks para durmientes):

norte


2.
SRD
ii

yo 1

los F k es el nmero de lazos en la k simo grupo de los vnculos entre la R yo 'S, y el gramo metro es el nmero de lazos en la metro simo grupo de los
vnculos entre la S yo 'S.

por n> 9, la probabilidad de no cero r s ( dos colas) se calcula utilizando una t prueba con norte- 2 grados de libertad:

2
s 2
.
1 RNRT
s

para los pequeos norte esta aproximacin no es exacta, y para n <= 9 Por lo tanto, el programa cambia automticamente a una prueba exacta.
Esta prueba compara el observado r s a los valores obtenidos a partir de todas las posibles permutaciones de la primera columna.

La prueba asinttica en re est estrechamente relacionado con la prueba de r s ( ver Press et al. 1992). Se calcula para todos n ( ninguna prueba exacta

para la pequea norte).

tau de Kendall

Este coeficiente de correlacin no paramtrico no est en uso muy comn. Se calcula de acuerdo con Press et al. (1992). Todo
posible N (N- 1) se consideran / 2 pares de puntos de datos bivariados. Si dos pares tienen la misma direccin en x como en y (x y y tanto
disminucin o aumento tanto), se les llama
concordante. Si no es as, son discordante. Un empate en el x 'S se llama una extra-x, y un empate en el y 'S se llama una extra-y. Parejas con
vnculos en ambas variables se descartan. El nmero de pares en las cuatro categoras se cuenta. Entonces,

concordante discordante
.
concordante discordante concordantes
extray discordante extrax

La prueba asinttica se basa en la tau de Kendall siendo aproximadamente normal, con media cero y

10 4
var
.
9NNN
1

72
correlacin Polyserial

Esta correlacin se realiza slo si la segunda columna consiste de nmeros enteros con un rango de menos de
100. Est diseado para correlacionar una variable continua / intervalo distribuido normalmente (primera columna) con una variable ordinal
(segunda columna) que Cestos de una variable normalmente distribuida. Por ejemplo, la segunda columna podra contener los nmeros 1-3
de codificacin para pequeo, medio y grande. Habra tpicamente ms medio que los valores de pequeos o grandes, debido a la
distribucin normal subyacente de tamaos.

Pasado utiliza el algoritmo de dos pasos de Olsson et al. (mil novecientos ochenta y dos). Esto es ms preciso que su perito ad hoc, y casi tan

preciso como el algoritmo multivariante completa ML. El algoritmo de dos pasos fue elegido debido a la velocidad, lo que permite una prueba de

permutacin (pero slo para N < 100; todava no est en el pasado 3). para mayor norte la prueba asinttica dado (test log-ratio) es exacta.

correlacin lineal parcial

Usando esta opcin, para cada par de columnas, la correlacin lineal se calcula mientras que el control para todas las columnas
restantes. Por ejemplo, con tres columnas A, B, C la correlacin AB se controla para C; AC es controlada por B; BC se controla para A.
La correlacin lineal parcial se puede definir como la correlacin de los residuos despus de la regresin de la variable (s) de control.
La significacin se calcula con una t prueba con norte- 2- k grados de libertad, donde k es el nmero de variables de control:

knrt
2
1 2 r

pruebas de permutacin

pruebas de permutacin de Monte Carlo (N = 9999) estn disponibles para todos los coeficientes de correlacin excepto correlacin
polyserial y parcial.

referencias

Olsson, U., F. Drasgow y NJ Dorans. 1982. El coeficiente de correlacin polyserial. Psychometrika


47: 337-347.

Prensa, WH, SA Teukolsky, WT Vetterling y BP Flannery. 1992. Numerical Recipes en C. Cambridge University Press.

73
de correlacin intraclase

Un uso tpico del coeficiente de correlacin intraclase (ICC) es cuantificar calificadores fiabilidad, es decir, nivel de acuerdo entre evaluadores
varios '' la medicin de los mismos objetos. Es una herramienta estndar para evaluar el error de medicin. ICC = 1 indicara una fiabilidad
perfecta. Los evaluadores (o 'jueces') van en columnas, mientras que los objetos medidos van en filas. En el siguiente ejemplo hay cuatro
evaluadores AB, que han medido 6 objetos.

Pasado sigue la referencia estndar, Shrout y Fleiss (1979), que proporciona un nmero de diferentes coeficientes, referidos como
ICC ( m, k) dnde metro es el tipo de modelo. Si k = 1, el coeficiente evala mediciones individuales (por un solo evaluador); de lo
contrario, evala la medicin promedio a travs de evaluadores. Los modelos son

Modelo 1: los evaluadores de calificacin diferentes objetos son diferentes, y se tomaron muestras al azar de un conjunto ms amplio de los evaluadores

Modelo 2: los mismos evaluadores califica a todos los objetos, y los evaluadores son un subconjunto de un conjunto mayor de evaluadores.

Modelo 3: suposiciones sobre los calificadores.

El ICC ms comnmente utilizado es ICC (2,1), por lo tanto, que est marcado en rojo en el pasado.

74
El anlisis se basa en un ANOVA de dos vas sin replicacin, como se describe en otra parte en este manual. Los intervalos de
confianza son paramtricas, siguiendo las ecuaciones de Shrout y Fleiss (1979). Los datos en el ejemplo anterior son del papel
Shrout y Fleiss, la salida del pasado reproducir sus resultados.

Referencia

Shrout, PE, Fleiss, JL 1979. correlaciones intraclase: Aplicaciones en la evaluacin de calificadores fiabilidad. Psychological Bulletin 86: 420-428.

75
pruebas de normalidad

Tres pruebas estadsticas para la distribucin normal de una o varias muestras de datos univariados, dados en una o ms columnas separadas o
con una columna de datos individual y una columna de grupo. Los datos utilizados a continuacin fueron generados por los generadores normales
y uniformes de nmeros aleatorios en el pasado ( 'Evaluar la expresin' mdulo).

Para las tres pruebas, la hiptesis nula es

MARIDO 0: La muestra fue tomada de una poblacin con distribucin normal.

Si el dado pag( normal) es menor que 0,05, la distribucin normal puede ser rechazado (marcado en color rosa). De las pruebas dadas, la
Shapiro-Wilk y Anderson-Darling se consideran para ser el ms exacto, y la Jarque-Bera se da como referencia. Una prueba an ms pobres (de
cuatro bin chi-cuadrado) se incluy en las versiones anteriores del pasado. Hay un tamao mximo de la muestra de n = 5000, mientras que el
tamao mnimo de la muestra es de 3 (las pruebas, por supuesto, tienen extremadamente pequea potencia de tan pequea norte).

Recuerde que el problema de mltiples pruebas si ejecuta estas pruebas en varias muestras - una u otra correccin de Bonferroni pueden
ser apropiados.

prueba de Shapiro-Wilk

La prueba de Shapiro-Wilk (Shapiro y Wilk 1965) devuelve una estadstica de prueba W, que es pequeo para muestras no normales, y una pag
valor. La aplicacin se basa en el cdigo estndar AS R94 (Royston 1995), para corregir una inexactitud en el algoritmo anterior AS 181
para muestras de gran tamao.

76
prueba de Jarque-Bera

La prueba de Jarque-Bera (Jarque y Bera 1987) se basa en asimetra S y curtosis K. La estadstica de prueba es

2
n JB
KS

2

6 43

.

En este contexto, la asimetra y curtosis son utilizados


S1
XXII
23

1

ii

XXII

,


K1
XXII 24

1

ii

XXII

.

Tenga en cuenta que estas ecuaciones contienen estimadores ms sencillo que el GRAMO 1 y GRAMO 2 da en el mdulo de estadsticas de resumen

univariante, y que la curtosis aqu ser 3, no es cero, para una distribucin normal.

Asinttica (para tamaos de muestra grande), la prueba estadstica tiene una distribucin chi-cuadrado con dos grados de libertad, y esto
constituye la base de la pag valor dado por el pasado. Se sabe que este enfoque funciona bien slo para muestras de gran tamao, y por lo tanto
con anterioridad tambin incluye una prueba de significacin basada en la simulacin de Monte Carlo, con 10.000 valores tomadas al azar de una
distribucin normal.

prueba Anderson-Darling

Los datos x yo se ordenan en orden ascendente, y se normalizaron para la media y desviacin estndar:

XYii
.

Con F la funcin cumulativedistribution normal (CDF), la estadstica de prueba es


norte
ln lnYFYF
1 2 1 1 Una 1 kn .
2
posada yo
yo 1

Importancia se estima de acuerdo con Stephens (1986). En primer lugar, se aplica una correccin para el tamao pequeo de la muestra:

* 2 2 01 . 2 75. 25
.
AA
2
nn

77
los pag valor se calcula como

UN*
2
*2 2 *2
exp.
1 .
2937
5 UN 0 709 . 0186 UN 0. 6

. Automvil

2
*2 *2 *2
exp
0 .
9177
4 1 279 . 38
club britnico 0.
UN 0 34 .6
pag
UN
2
*2 *2 *2
1.
8 exp 42 .
318 un796 59 . 938 0. UN 0 2 .6

exp
1 13 . 101 .
436
*2
un14 223 . 73
* 2
una
2
a
*2
0. 2

Esta aproximacin se descompone para grandes UN* 2. por lo tanto, ltimos juegos p = 0 para UN* 2> 100.

Datos perdidos: Apoyado por eliminacin.

referencias

Jarque, CM & Bera, AK 1987. Una prueba de normalidad de las observaciones y residuos de la regresin.
Revista Internacional de Estadstica 55: 163-172.

Royston, P. 1995. Un comentario sobre el AS 181: El W- prueba de normalidad. Estadsticas aplicadas 44: 547-551.

Shapiro, SS y Wilk, MB 1965. Un anlisis de la prueba de varianza para la normalidad (muestras completas).

Biomtrika 52: 591-611.

Stephens, MA 1986. Las pruebas basadas en las estadsticas del FED. Pginas. 97-194 en D'Agostino, RB & Stephens, MA (eds.), Tcnicas de

bondad de ajuste. Nueva York: Marcel Dekker.

78
Tabla de contingencia (Chi 2 etc.)

Estas pruebas esperan una tabla de frecuencias con el nmero de elementos en diferentes categoras (filas y columnas). Filas representan los
diferentes estados de una variable nominal, las columnas representan los estados de otra variable nominal, y las clulas contienen los
recuentos enteros de ocurrencias de ese estado especfico (fila, columna) de las dos variables. El anlisis de la tabla de contingencia entonces
da informacin sobre si las dos variables de taxn y localidad estn asociados. Por ejemplo, esta prueba puede usarse para comparar dos
muestras (columnas) con el nmero de individuos en cada taxn organizada en las filas. Usted debe tener cuidado con esta prueba si alguna
de las clulas contienen menos de cinco individuos (vase la prueba exacta de Fisher ms adelante).

Se da la significacin de asociacin entre las dos variables, con pag los valores de la distribucin chi-cuadrado y de una
permutacin de prueba con 9999 repeticiones.

La "muestra vs. esperado" caja debe ser marcado si tiene dos columnas, y su segunda columna consiste de los recuentos de una
distribucin terica (valores esperados) con error cero muestreo, posiblemente no entero. Esto es no una correccin pequea muestra. En
este caso, slo la prueba de chi-cuadrado est disponible.

La prueba de permutacin de Monte Carlo utiliza el nmero determinado de repeticiones al azar. Por "vs. esperado de la muestra" estas rplicas
son generadas por mantener los valores esperados fijos, mientras que los valores de la primera columna son al azar con probabilidades relativas
segn lo especificado por los valores esperados, y con suma constante. Para dos muestras, todas las clulas son al azar, pero con constantes de
fila y columna sumas.

Vase, por ejemplo Brown & Rothery (1993) o Davis (1986) para detalles.

los La prueba exacta de Fisher tambin se da (de dos colas). Cuando est disponible, la prueba exacta de Fisher puede ser superior a la de

chi-cuadrado. Para tablas grandes o tallas grandes, el tiempo de clculo puede ser prohibitivo

79
y se apaga despus de un minuto. En tales casos, la prueba no paramtrica es probablemente aceptable en cualquier caso. El
procedimiento es complejo, y basndose en el algoritmo de la red de Mehta y Patel (1986).

se dan otras dos medidas de asociacin. Ambos son transformaciones de chi-cuadrado (Press et al.
1992). Con norte la suma total de los cargos, METRO el nmero de filas y norte el nmero de columnas:

2

Cramer V:
n V , NM
minuto
1 1

2

coeficiente de contingencia DO: C
2
n

Derechos residuales de autor

Si se obtiene una asociacin significativa ( p < 0,05) en la prueba de ji cuadrado, puede ser de inters para ver cul de las clulas
contribuyen ms fuertemente a la desviacin de los valores esperados bajo la hiptesis nula de no asociacin (anlisis post-hoc). La tabla
de los residuos puede mostrar los siguientes valores para cada clula:

residuales crudas: OE, dnde O es lo observado y mi el valor esperado.

(residuos estandarizados: OE) / MI, la estandarizacin de la magnitud del valor esperado.

residuos corregidos:

EO
resid
_ adj ,
mi RowMargina 1
norte ColumnMarg 1 / l
inal/ norte

donde el RowMarginal es la suma de fila y ColumnMarginal es la suma de columna de la celda en cuestin.

Los residuos ajustados estn aproximadamente normalmente distribuidos, lo que significa que los valores fuera del intervalo twosigma [-1.96,
1.96] puede considerarse significativa en p < 0,05, aunque se aplica el problema de mltiples pruebas.

Los datos que faltan no son compatibles.

referencias

Brown, D. y P. Rothery. 1993. Modelos de la biologa: matemticas, estadstica e informtica. John Wiley & Sons.

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

Mehta, CR & NR Patel. 1986. Algoritmo 643: FEXACT: una subrutina FORTRAN para la prueba exacta de Fisher de r desordenada tablas

de contingencia c. ACM Transactions on Mathematical Software 12: 154-161.

80
Prensa, WH, SA Teukolsky, WT Vetterling y BP Flannery. 1992. Numerical Recipes en C. Cambridge University Press.

prueba de Cochran-Mantel-Haenszel

Al igual que en la prueba de chi-cuadrado, pero varias pruebas (repetidos) tablas de contingencia 2x2 al mismo tiempo, con el fin de controlar para un

factor de molestia (Mantel y Haenszel 1959). Un ejemplo podra estar controlando para la temporada cuando las pruebas de los efectos de un

medicamento que se utiliza en experimentos repetidos a travs de un ao. Las tablas de 2x2 deben recibir en filas consecutivas en la hoja de clculo

(en primer lugar, una tabla 2x2, seguido a continuacin por la mesa de al lado, etc.).

Nuestro algoritmo sigue McDonald (2014). Indexacin de las tablas individuales de k, escribimos una tabla en particular como

kk
en Letras
licenciado
.
continua
corriente
kk

Con METRO el nmero de mesas, y norte k = un k + segundo k + do k + re k, la chi-cuadrado se calcula como

2

ncabaa
0. 5
kkkkkk

2 MH k1
METRO
.


M 3
2
nndcdbcaba
kkkkkkkkkk
k1

Tenga en cuenta que otros, algebraicamente equivalentes, las formas se dan a menudo en la literatura. La sustraccin de

0.5 es una correccin de continuidad, no siempre incluido en otro software. Esta prueba estadstica se distribuye de la 2 con un grado
de libertad.

Adems, el odds ratio comn (igual a uno para la independencia total) se calcula utilizando la Mantel-Haenszel (1959)
estimacin:

nda
kkk

MH
k 1
M
.
METRO

BCN
kkk
k1

Los datos que faltan no son compatibles.

referencias

Mantel, N. y W. Haenszel. 1959. Aspectos estadsticos de los anlisis de datos de estudios retrospectivos de la enfermedad. Revista del
Instituto Nacional del Cncer 22: 719-748.

81
McDonald, JH 2014. Handbook of Statistics biolgicos (3 ed.). Sparky House Publishing, Baltimore, Maryland.

82
Riesgo / probabilidades

Este mdulo compara los cargos de un resultado binario bajo dos tratamientos diferentes, con estadsticas que son de uso comn en la

medicina. Los datos se introducen en una tabla 2x2, con tratamientos en filas y cargos de los dos resultados diferentes en las columnas.

El siguiente ejemplo muestra los resultados de un ensayo de vacunacin en 460 pacientes:

Tienes la gripe No tuvimos la oportunidad de influenza

Vacuna 20 220

Placebo 80 140

En general, los datos toman la forma

resultado 1 resultado 2

tratamiento 1 re 1 marido 1

tratamiento 2 re 0 marido 0

83
Dejar norte 1 = re 1+ marido 1, norte 0 = re 0+ marido 0 y pag 1 = re 1 / norte 1, pag 0 = re 0 / norte 0. Las estadsticas se calculan entonces de la siguiente manera:

diferencia de riesgo: RD = p 1- pag 0

intervalo de confianza del 95% sobre la diferencia de riesgo (chi-cuadrado de Pearson):

1 pps
1| 1
1 ppn 00 |
mi
1
norte
0

Intervalo: RD - 1.96 s mi a RD + 1.96 s mi

Z prueba en la diferencia de riesgo (de dos colas):

RD z
s mi

Radio de riesgo: RR = p 1 / pag 0

intervalo de confianza del 95% en cociente de riesgos ( mtodo de delta):

1 1 1 ln 1

RR s mi ndnd
011 0

1. 96 s mi
e
EF

Intervalo: RR / EF a RR x EF

Z prueba en cociente de riesgos (de dos colas):

En

z
s mi
RR

OR 1
hd1
Odds ratio:
0
hd0

intervalo de confianza del 95% en odds ratio ( frmula de Woolf):

1 1 1 ln 1

OR s mi hdhd
011 0

1. 96 s mi
e
EF

Intervalo: OR / EF a O x EF

Tenga en cuenta que actualmente no existe correccin de continuidad.

Datos perdidos No estn permitidos y dar un mensaje de error.

84
proporcin individual

Un mdulo simple para calcular la probabilidad de una proporcin observada (muestra) (en el rango 0-1) contra una proporcin

hipottico. No se requieren datos de entrada en la hoja de clculo.

Con pag la proporcin de la muestra, PAG la proporcin hipottico, y norte el tamao de la muestra, se calcula la desviacin estndar

1
.
n PP

Adems, se calcula el z ( distribucin normal) Estadstica

P
pz .

El (de dos colas) significacin se calcula directamente a partir de z y la distribucin normal.

El intervalo de confianza 95% para la proporcin se calcula utilizando dos mtodos diferentes. El intervalo de 'exacto' se calcula

utilizando el mtodo Clopper-Pearson (Clopper y Pearson 1934) como

1 1


xn 1 xn
1
1 2; 2 1 1
21 2; xF, 2 XNX
1 F x , 2 xnx


dnde = 0.05, x es el nmero de xitos calculadas como redonda ( pn), y F (c; d 1, re 2) es el 1- do


cuantil de una F con la distribucin re 1 y re 2 grados de libertad.

La aproximacin normal se calcula como

)
1 ( ppb

norte

1 CI . 96 ,
1. 96 bPBP

El CI aproximacin normal se utiliza ms comnmente. El IC exacto es ms preciso para pequeas n. Para grande norte los dos mtodos

dar resultados similares.

Referencia

Clopper, C. & Pearson, ES 1934. El uso de confianza o lmites fiduciales ilustrados en el caso de la binomial. Biomtrika 26:
404-413.

85
los intervalos de confianza proporcin mltiples

Acepta dos columnas de datos, la primera columna con proporciones dadas como porcentajes (0-100) y los tamaos de las muestras segunda

columna que contiene ( NORTE). El programa calcular intervalos de confianza del 95% para todas las proporciones utilizando el mtodo

Clopper-Pearson (ver arriba), y la trama de ellos.

se tienen en cuenta los datos que faltan.

86
El anlisis de supervivencia (curvas de Kaplan-Meier, la prueba de log-rank etc.)

El anlisis de supervivencia para dos grupos (tratamientos) con posibilidad de censura derecha. El mdulo de traza las curvas de

supervivencia de Kaplan-Meier para los dos grupos y calcula tres pruebas diferentes para la equivalencia. El programa prev cuatro

columnas. La primera columna contiene los tiempos hasta el fallo (muerte) o censurar (fallo no se observa hasta e incluyendo el tiempo dado)

para el primer grupo, la segunda columna indica el fracaso (1) o censurar (0) para los individuos correspondientes. Las dos ltimas columnas

contienen datos para el segundo grupo. tiempos de fallo debe ser mayor que cero.

El programa tambin acepta slo un tratamiento (dado en dos columnas), o ms de dos tratamientos en pares consecutivos de columnas, el

trazado de una o varias curvas de Kaplan-Meier. Las pruebas estadsticas solamente estn comparando los dos primeros grupos, sin embargo.

Las curvas de Kaplan-Meier y el log-rank, pruebas de Wilcoxon y Tarone-Ware se calculan de acuerdo con Kleinbaum y Klein
(2005).

El tiempo promedio para el fracaso incluye los datos censurados. peligros promedio es de nmero de fallos dividido por la suma de los tiempos de

fallo o la censura.

La prueba de log-rank es por chi-cuadrado en el segundo grupo:

2

2

2 em
2 jj


2
2 2EO j
.
var 2 EO
mmnnmmnn

2 1212121 2 jjjjjjjj

j
1221
nnnn
2 jjjj
1

87
Aqu, norte ij es el nmero de individuos en riesgo, y metro ij el nmero de fallos, en el grupo yo en tiempo de fallo distinto j. El nmero

esperado de fallas en el grupo 2 en el tiempo de fallo j es

mmne
2 jjjj

122
.
1 nn2 jj

El chi-cuadrado tiene un grado de libertad.

Las pruebas de Wilcoxon y Tarone-Ware son versiones ponderadas de la prueba de log-rank, donde los trminos en las frmulas de adicin

para O 2- mi 2 y var ( O 2- mi 2) recibir pesos de norte j y norte j, respectivamente. Por tanto, estos ensayos dan ms peso a los tiempos de falla

temprana. Ellos no son de uso comn en comparacin con la prueba de log-rank.

Este mdulo no es estrictamente necesario para el anlisis de supervivencia sin derecho censurando - la prueba de Mann-Whitney puede ser suficiente

para este caso ms simple.

Datos perdidos: Los puntos de datos con valor faltante en una o ambas columnas se tienen en cuenta.

Referencia

Kleinbaum, DG & Klein, M. 2005. El anlisis de supervivencia: un texto de auto-aprendizaje. Saltador.

88
combinar errores
Un mdulo sencillo para producir una media ponderada y su desviacin estndar a partir de una coleccin de mediciones con errores

(un sigma). Espera dos columnas: los datos x y sus errores de una sola sigma

. La suma de las distribuciones gaussianas individuales tambin se traza.

La media ponderada y su desviacin estndar se calculan como

x ii

, .

2
1 1 1
22

ii yo
yo yo

Este es el estimador de mxima probabilidad para la media, suponiendo que todas las distribuciones individuales son normales con la misma

media.

Datos perdidos: se eliminan filas con datos faltantes en una o en ambas columnas.

89
men Multivar

Componentes principales

Anlisis de componentes principales (PCA) encuentra las variables hipotticas (componentes) que representan lo ms posible de la varianza en los
datos multivariados (Davis 1986, Harper, 1999). Estas nuevas variables son combinaciones lineales de las variables originales. PCA se puede usar
para la reduccin del conjunto de datos de slo dos variables (los dos primeros componentes), para el trazado propsitos. Tambin se podra
plantear la hiptesis de que los componentes ms importantes estn relacionados con otras variables subyacentes. Para los datos morfomtricos,
esto podra ser de tamao, mientras que para los datos ecolgicos que podra ser un gradiente fsica (por ejemplo, temperatura o profundidad).
Bruton y Owen (1988) describen una aplicacin tpica morfomtrico de PCA.

Los datos de entrada es una matriz de datos multivariados, con artculos en filas y variables aleatorias en columnas.

La rutina de PCA encuentra los valores propios y los vectores propios de la matriz de varianza-covarianza o la matriz de correlacin, con el
algoritmo de SVD. Utilice varianza-covarianza si todas las variables se miden en las mismas unidades (por ejemplo, centmetros). Utilice
correlacin (normalizado var-COVAR) si las variables se miden en unidades diferentes; esto implica la normalizacin de todas las variables
utilizando la divisin por sus desviaciones estndar. Los valores propios dan una medida de la varianza explicada por los vectores propios
correspondientes (componentes). Los porcentajes de varianza explicada por el tambin se dan estos componentes. Si la mayor parte de la
varianza se explica por los primeros uno o dos componentes, que ha anotado un xito, pero si la varianza se distribuye ms o menos
uniformemente entre los componentes, el PCA tiene en un sentido no ha sido muy exitosa.

En el ejemplo siguiente (puntos de referencia a partir de crneos gorilla), componente 1 es fuerte, explicando 45,9% de la varianza. Los
intervalos de confianza bootstrap no se muestran ONU menos el valor de 'Bootstrap N' es distinto de cero.

90
grupos: Si los grupos se especifican con una columna de grupo, el PCA puede, opcionalmente, ser llevada a cabo withingroup o entre los
grupos. En dentro del grupo PCA, la media dentro de cada grupo se resta antes de anlisis propio, eliminando esencialmente las diferencias
entre grupos. En entre grupos PCA, el anlisis propio se lleva a cabo en las medias de los grupos (es decir, los elementos analizados son los
grupos, no las filas). Por tanto dentro de los grupos y entre grupos PCA, las puntuaciones de PCA se calculan utilizando productos
vectoriales con los datos originales.

De modo de fila bootstrapping se lleva a cabo si un nmero positivo de repeticiones de arranque (por ejemplo, 1000) se da en el cuadro
'Bootstrap N'. Los componentes bootstrapped son re-ordenados y revirtieron segn Peres-Neto et al. (2003) para aumentar la
correspondencia con los ejes originales. los intervalos de confianza bootstrap 95% se dan para los valores propios.

El 'grfico de sedimentacin' (argumento sencillo de valores propios) tambin puede indicar el nmero de componentes significativos. Despus de esta
curva comienza a aplanarse, los componentes pueden ser considerados como insignificantes. intervalos de confianza del 95% se muestran si
bootstrapping ha llevado a cabo. Los valores propios previstos bajo un modelo aleatorio (Broken palillo) estn opcionalmente trazan - autovalores bajo
esta curva pueden representar componentes no significativos (Jackson, 1993).

En el ejemplo gorila anteriormente, los valores propios de los 16 componentes (lnea azul) se encuentran por encima de los valores de palo roto (rojo La

lnea de puntos) para los dos primeros componentes, aunque el palo roto est dentro del intervalo de confianza del 95% para el segundo componente.

La opcin 'Ver dispersin' muestra todos los puntos de datos (filas) representan en el sistema de coordenadas determinado por dos de los
componentes. Si tiene grupos, que se muestra con diferentes smbolos y colores. El rbol de expansin mnima es la ms corta posible de lneas
que conectan todos los puntos. Esto puede ser utilizado como una ayuda visual en la agrupacin de puntos cercanos. El MST se basa en una
medida de la distancia euclidiana de los puntos de datos originales, y es ms significativo cuando todas las variables utilizan la misma unidad. La
opcin 'Biplot' muestra una proyeccin de los ejes originales (variables) en el diagrama de dispersin. Esta es otra visualizacin de las cargas de
PCA (coeficientes) - ver ms abajo.

91
Si est marcada la "escala Eigenval", los puntos de datos se escalarn por 1 re k , y los vectores propios biplot

por re k- este es el biplot correlacin de Legendre y Legendre (1998). Si no est marcada, los puntos de datos no se ajustan a escala, mientras

que los vectores propios biplot se normalizan a la misma longitud (pero no a la unidad, por razones grficas) - Este es el biplot distancia.

La opcin 'Ver' cargas muestra hasta qu punto sus diferentes variables originales (que figuran en el orden original a lo largo del eje
x) entran en los diferentes componentes (a eleccin en el panel de botones de radio). Estas cargas componentes son importantes
cuando se trata de interpretar el 'sentido' de los componentes. La opcin 'Coeficientes' da los coeficientes de PC, mientras que
'Correlacin' da la correlacin entre una variable y las puntuaciones de PC. Si bootstrapping se ha realizado, los intervalos de
confianza del 95% se muestran (slo para la opcin de coeficientes).

Datos perdidos puede ser manejado por uno de dos mtodos:

1. El valor medio de la imputacin: Los valores perdidos se sustituirn por su promedio de la columna. No

recomendado.
2. imputacin iterativa: Los valores perdidos son reemplazados por inititally su promedio columna. Una tirada inicial de PCA se utiliza
para calcular los valores de regresin para los datos que faltan. El procedimiento se repite hasta la convergencia. Este suele ser
el mtodo preferido, pero puede causar algunos sobreestimacin de la fuerza de los componentes (ver Ilin y Raiko 2010).

92
referencias

Bruton, DL & AW Owen. 1988. El noruego Ordovcico superior illaenid trilobites. Norsk Geologisk Tidsskrift 68: 241-258.

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

Harper, DAT (ed.). 1999. numrica Paleobiologa. John Wiley & Sons.

Ilin, A. & T. Raiko. 2010. Enfoques prcticos para anlisis de componentes principales en la presencia de los valores que faltan. Revista de
Investigacin de la mquina de aprendizaje 11: 1957-2000.

Jackson, DA 1993. reglas en anlisis de componentes principales de interrupcin: una comparacin de mtodos heursticos y estadsticos. Ecologa
74: 2204-2214.

Peres-Neto, PR, DA Jackson y KM Somers. 2003. Dando una interpretacin significativa a los ejes de ordenacin: evaluar la significacin de
carga en el anlisis de componentes principales. Ecologa 84: 2347-2363.

93
coordenadas principales

anlisis coordenadas principales (PCO) es otro mtodo de ordenacin, tambin conocido como Metric
Multidimensional Scaling. El algoritmo es de Davis (1986).

La rutina de PCO encuentra los valores propios y los vectores propios de una matriz que contiene las distancias o similitudes entre todos
los puntos de datos. La medida Gower normalmente se utiliza en vez de la distancia euclidiana, que da resultados similares a PCA. Un
adicional de once medidas de distancia estn disponibles stos se explican en el anlisis de conglomerados. Los valores propios, dando
una medida de la varianza explicada por los vectores propios correspondientes (coordenadas) se dan durante los primeros cuatro
coordenadas ms importantes (o menos si hay menos de cuatro puntos de datos). Los porcentajes de varianza explicada por el tambin
se dan estos componentes.

Los valores de similitud / distancia se elevan a la potencia de c ( el "exponente Transformacin") antes de anlisis propio. El valor
estndar es c = 2. Los valores ms altos (4 o 6) pueden reducir el efecto de "herradura" (podn y Miklos 2002).

La opcin 'Ver dispersin' le permite ver todos los puntos de datos (filas) trazan en el sistema de coordenadas propuesta por el OCP. Si ha de
color (agrupadas) filas, los diferentes grupos se mostrarn utilizando diferentes smbolos y colores. La opcin de "escalamiento de valores
propios" escalas de cada eje utilizando la raz cuadrada del valor propio (recomendado). La opcin de rbol de expansin mnimo se basa en
la similitud seleccionado o el ndice de distancia en el espacio original.

datos que falta es apoyado por eliminacin de pares (no para la Raup-Crick, Rho o ndices definidos por el usuario).

referencias

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

Podn, J. & I. Miklos. 2002. Los coeficientes de semejanza y el efecto de herradura en el anlisis de coordenadas principales. Ecologa
83: 3331 hasta 3343.

94
MDS no mtricos

escalamiento multidimensional no mtrico se basa en una matriz de distancias calculadas con cualquiera de las 21 medidas de distancia
compatibles, como se explica en Semejanza y Distancia ndices anteriormente. El algoritmo luego intenta colocar los puntos de datos en un
sistema de coordenadas de dos o tres dimensiones de tal manera que la clasificados diferencias se conservan. Por ejemplo, si la distancia original
entre los puntos 4 y 7 es el noveno ms grande de todas las distancias entre dos puntos, puntos 4 y 7 pondr preferentemente de tal manera que
su distancia eucldea en el plano 2D o en el espacio 3D sigue siendo el noveno ms grande. escalamiento multidimensional no mtrico
intencionadamente no toma en cuenta las distancias absolutas.

El programa puede converger en una solucin diferente en cada ejecucin, dependiendo de las condiciones iniciales. Cada ejecucin es en realidad
una secuencia de 11 ensayos, de los cuales se elige el que tiene la tensin ms pequea. Uno de estos ensayos PCO utiliza como condicin inicial,
los otros son aleatorios. La solucin se hace girar automticamente a los ejes mayores (2D y 3D).

El algoritmo implementado en el pasado, que parece funcionar muy bien, se basa en un nuevo enfoque desarrollado por
Taguchi y Oono (2005).

La opcin de rbol de expansin mnimo se basa en la similitud seleccionado o el ndice de distancia en el espacio original.

Variables ambientales: Es posible incluir una o ms columnas iniciales que contienen variables adicionales ambientales para el
anlisis. Estas variables no estn incluidos en la ordenacin. Los coeficientes de correlacin entre cada variable ambiental y las
puntuaciones NMDS se presentan como vectores desde el origen. La longitud de los vectores son arbitrariamente a escala en hacer
una biplot legible, de modo que slo sus direcciones y longitudes relativas debe ser considerado.

Shepard parcela: Esta trama de obtenido frente a filas observados (destino) indica la calidad del resultado. Idealmente, todos los puntos deben
ser colocados en una lnea recta ascendente ( x = y). los R 2 los valores son los coeficientes de determinacin entre las distancias a lo largo de
cada eje ordenacin y las distancias originales

95
(Tal vez no es un valor muy significativo, pero es reportado por otros programas NMDS modo se incluye para la integridad).

Datos perdidos est soportado por eliminacin de pares (no para la Raup-Crick, Rho y los ndices definidos por el usuario). Para
las variables ambientales, valores perdidos no se incluyen en el clculo de correlaciones.

Referencia

Taguchi, Y.-H., Oono, Y. 2005. patrones relacionales de la expresin gnica a travs de anlisis de escalamiento

multidimensional no mtrico. bioinformtica 21: 730-40.

96
El anlisis de correspondencias

El anlisis de correspondencias (CA) es otro mtodo de ordenacin, algo similar a la PCA pero para
datos contados. Para la comparacin de asociaciones (columnas) que contiene el recuento de los taxones, o taxones contado (filas) a travs de
asociaciones, CA es el algoritmo ms apropiado. Adems, CA es ms adecuado si espera que las especies tienen respuestas unimodales a los
parmetros subyacentes, es decir, estn a favor de un cierto rango del parmetro, cada vez menos frecuente para los valores ms bajos y ms altos
(esto es en contraste con PCA, lo que supone una respuesta lineal ).

La rutina de CA encuentra los valores propios y los vectores propios de una matriz que contiene las distancias chi-cuadrado entre todas
las filas (o columnas, si eso es ms eficiente - el resultado es el mismo). El algoritmo sigue Greenacre (2010), la enfermedad vesicular
porcina. El valor propio, dando una medida de la similitud explica por el vector propio correspondiente, se da para cada vector propio.
Los porcentajes de similitud representaron por tambin se dan estos componentes.

La opcin 'Ver dispersin' le permite ver todos los datos de puntos (filas) trazan en el sistema de coordenadas dado por la CA. Si ha
agrupado filas, los diferentes grupos se pueden mostrar usando cascos convexas separadas y elipses de concentracin.

Adems, las variables (columnas, asociaciones) se pueden representar en el mismo sistema de coordenadas (modo Q), que incluye
opcionalmente las etiquetas de columna. Si los datos son 'una buena conducta', taxones tpicos de una asociacin debe trazar en las proximidades
de dicha asociacin.

Retransmitir trama (an no en ltimos 3): Este es un diagrama compuesto con una parcela por columna. Las parcelas estn ordenados de acuerdo con
puntajes de las columnas CA. Cada punto de datos se representa con CA primero-eje de fila puntuaciones en el eje vertical, y el valor del punto de datos

original (abundancia) en la columna dado en el eje horizontal. Esto puede ser ms til cuando las muestras estn en filas y taxones en columnas. La

trama de retransmisin a continuacin, se

97
mostrar los taxones ordenados de acuerdo con sus posiciones a lo largo de los gradientes, y para cada taxn la trama correspondiente debe
mostrar idealmente un pico unimodal, en parte se superpone con el pico de la siguiente taxn lo largo del gradiente (ver Hennebert y Lees
1991 para un ejemplo de sedimentology) .

datos que faltan es apoyado por sustitucin promedio de la columna.

Referencia

Greenacre, M. 2010. Biplots en la prctica. Fundacin BBVA, 237 pp.

Hennebert, M. & A. Lees. 1991. Los gradientes ambientales en los sedimentos de carbonato y rocas detectadas por anlisis de
correspondencias: ejemplos de la reciente de Noruega y el Dinantian del sudoeste de Inglaterra. sedimentologa 38: 623-642.

98
anlisis de correspondencia Detrended

El mdulo (DCA) Detrended correspondencia utiliza el mismo algoritmo que DECORANA (Hill & Gauch
1980), con modificaciones de acuerdo con Oxanen y Minchin (1997). Est especializado para su uso en juegos 'ecolgicos' de datos con los

datos de la abundancia; muestras en filas, taxones en columnas.

Valores propios de los cuatro ejes de ordenacin se dan como en CA, lo que indica su importancia relativa en la explicacin de la dispersin de
los datos.

Detrending es una especie de procedimiento de normalizacin en dos pasos. El primer paso implica un intento de 'enderezar' puntos que se
encuentran en un arco, que es una ocurrencia comn. El segundo paso implica 'tendido' los puntos para evitar el agrupamiento de los puntos
en los bordes de la trama. Detrending puede parecer un procedimiento arbitrario, pero puede ser una ayuda til en la interpretacin.

datos que faltan es apoyado por sustitucin promedio de la columna.

referencias

Hill, MO & HG Gauch Jr. 1980. anlisis Detrended Correspondencia: una tcnica de ordenacin mejorada. Vegetatio 42:
47-58.

Oxanen, J. & PR Minchin. 1997. La inestabilidad de los resultados de coordinacin bajo cambios en el orden de datos de entrada: explicaciones y

remedios. Revista de Ciencias de la vegetacin 8: 447-454.

99
de correspondencia cannica

Anlisis de Correspondencia Cannica (Legendre y Legendre, 1998 ) es el anlisis de correspondencias de una matriz de sitio / especies
en las que cada sitio ha dado valores para una o ms variables ambientales (temperatura, profundidad, tamao de grano, etc.). Los ejes
de ordenacin son combinaciones lineales de las variables ambientales. CCA es, pues, un ejemplo de anlisis de gradiente directo,
donde se sabe que el gradiente en las variables ambientales a priori y las abundancias de especies (o presencia / ausencia) se consideran
ser una respuesta a este gradiente.

Cada sitio debe ocupar una fila en la hoja de clculo. Las variables ambientales deben entrar en las primeras columnas, seguido
de los datos de abundancia (el programa le pedir el nmero de variables ambientales).

La puesta en prctica en el pasado sigue el algoritmo de anlisis propio dada en Legendre y Legendre (1998). Las ordenaciones se dan como
resultados de sitio - puntajes sitio armarios no estn actualmente disponibles. Las variables ambientales se representan como correlaciones con
las puntuaciones del sitio. Ambos batiduras (tipo 1 y 2) de Legendre y Legendre (1998) estn disponibles. Escala 2 hincapi en las relaciones
entre las especies.

Los valores perdidos son apoyados por medio de sustitucin de columna.

Referencia

Legendre, P. & L. Legendre. 1998. Ecologa numrica, 2 ed Ingls. Elsevier, 853 pp.

100
seriacin

Seriacin de una matriz de ausencia-presencia (0/1) utilizando el algoritmo descrito por Brower y Kile (1988). Este mtodo se aplica tpicamente a
una matriz de asociacin con taxones (especies) en las filas y las muestras en las columnas. Para seriation restringida (vase ms adelante), las
columnas deben ser ordenados de acuerdo con algn criterio, el nivel normalmente estratigrfica o posicin a lo largo de un gradiente de fauna
presunta.

Las rutinas de seriacin intentan reorganizar la matriz de datos de tal manera que las presencias se concentran a lo largo de la diagonal.
Hay dos algoritmos: restringidos y optimizacin sin restricciones. En optimizacin restringida, slo las filas (taxones) son libres de moverse.
Dada una ordenacin de las columnas, este procedimiento se encuentra el ordenamiento 'ptima' de filas, es decir, el orden de los taxones
que da a la trama ms bonita gama. Adems, en el modo restringido, el programa se ejecuta la simulacin un 'Monte Carlo', generando y
seriacin 30 matrices aleatorias con el mismo nmero de ocurrencias dentro de cada taxn, y compara estas a la matriz original para ver si
es ms informativo que un azar uno (este procedimiento es que consume tiempo para grandes conjuntos de datos).

En el modo sin restricciones, ambas filas y columnas son libres de moverse.

Los datos que faltan son tratadas como ausencias.

Referencia

Brower, JC & KM Kile. 1988. seriacin de una matriz de datos original como se aplica a paleoecologa.
Lethaia 21: 79-93.

101
anlisis factorial CABFAC, an no en los ltimos 3

Este mdulo implementa el mtodo de anlisis factorial y regresin ambiental clsica Imbrie y Kipp (1971)
(CABFAC y retroceso, vase tambin Klovan y Imbrie 1971).

El programa pregunta si la primera columna contiene los datos ambientales. Si no, un factor de anlisis sencillo con rotacin
Varimax se calcula sobre datos de fila-normalizado.

Si se incluyen los datos ambientales, los factores sern una regresin sobre la variable ambiental usando el segundo orden mtodo (parablica) de
Imbrie y Kipp, con trminos cruzados. Pasado, entonces informa de la regresin RMA de los valores ambientales originales contra los valores
reconstruidos a partir de la funcin de transferencia. Diferentes mtodos para la validacin cruzada (dejar uno fuera y k- doblar) estn disponibles.
Tambin puede guardar la funcin de transferencia como un archivo de texto que luego puede usarse para la reconstruccin del paleoambiente
(vase ms adelante). Este archivo contiene:

Nmero de taxones

Nmero de factores
Factor de puntuaciones para cada taxn

Nmero de coeficientes de regresin


Los coeficientes de regresin (trminos de orden primero y segundo, y en el origen)

Los valores perdidos son apoyados por medio de sustitucin de columna.

referencias

Imbrie, J. & NG Kipp. 1971. Un nuevo mtodo para la paleoclimatologa micropaleontolgico cuantitativa: Aplicacin a un ncleo de
finales del Pleistoceno Caribe. En: Los Cenozoico tardo Glacial Edad, editado por KK Turekian, pp 71-181, Yale Univ.. Press, New
Haven, CT.

Klovan, JE & J. Imbrie. 1971. Un programa de algoritmo y FORTRAN-IV para el anlisis del factor de modo Q a gran escala y el clculo de
puntuaciones de los factores. Geologa matemtica 3: 61-77.

102
Anlisis discriminante

Este mdulo proporciona anlisis discriminante para dos o ms grupos (este ltimo a veces se llama Canonical Anlisis variables
aleatorias). Los grupos deben especificarse con una columna de grupo.

Un diagrama de dispersin de las muestras a lo largo de los dos primeros ejes cannicos produce mxima y segundo a la separacin mxima
entre todos los grupos. Los ejes son combinaciones lineales de las variables originales como en PCA, y valores propios indican cantidad de
variacin explicada por estos ejes. Si slo se dan dos grupos, un histograma se representa en su lugar.

Faltan datos soportados por sustitucin promedio de la columna.

clasificador

Clasifica los datos, asignando a cada punto al grupo que da un mnimo de distancia de Mahalanobis a la media del grupo. La distancia de
Mahalanobis se calcula a partir de la matriz de covarianza dentro del grupo combinado, dando un clasificador discriminante lineal. Las
asignaciones de grupo dado y estimados se enumeran para cada punto. Adems, la asignacin de grupos es una validacin cruzada por una
licencia-un-out validacin cruzada procedimiento (jackknifing).

especmenes de misterio: Las filas con grupo desconocido, es decir, '?' En la columna de grupo, no estn incluidos en el propio anlisis discriminante,
pero ser clasificado. De esta manera, es posible clasificar los nuevos ejemplares que no forman parte del conjunto de entrenamiento.

103
Matriz de confusin

Una tabla con el nmero de puntos en cada grupo dado (filas) que se asignan a los diferentes grupos (columnas) por el clasificador.
Idealmente, cada punto debe ser asignado a su respectivo grupo dado, dando una matriz de confusin diagonal. Fuera de la diagonal
recuentos indican el grado de insuficiencia de la clasificacin.

detalles de clculo

Diferentes softwares utilizan diferentes versiones de CVA. Los clculos utilizados por el pasado se dan a continuacin.

Dejar segundo ser los datos dados, con norte artculos en filas y k variables aleatorias en las columnas, centrado en los grandes medios de columnas

(promedios de columna restan). Dejar gramo ser el nmero de grupos, norte yo el nmero de elementos en el grupo yo. calcular el gramo x k matriz x medios de

ponderados de dentro de los residuos de grupo, para el grupo de yo y variate j

ij
norte BX
ij i
,

dnde segundo
ij
es un promedio de la columna dentro del grupo yo. Calcular segundo 2 de segundo centrando dentro de los grupos. ahora calcular W

y el agrupado, matriz de covarianza normalizada, dentro de los grupos W cov:

2 BBW
2

1
W cov W .
gn

mi y T son los valores propios y los vectores propios de W; mi do y T do son los valores propios y los vectores propios de
W cov. Entonces,

diag1( ) XU
XU e ZZ diag1( e ) .

un y UN son los valores propios y los vectores propios de Z'Z. Tomamos solamente la primera gramo- 1 vectores propios (columnas de UN), como el resto

ser cero. Las variables cannicas son ahora

1 UCdo Un
diag
correo .

Los CVA resultados son entonces ANTES DE CRISTO. La cosificacin de variables puede hacerse a lo largo de vectores W cov DO.

104
En dos bloque PLS

De dos bloques de mnimos cuadrados parciales pueden verse como un mtodo de ordenacin comparable con PCA, pero con el objetivo de
maximizar la covarianza entre dos conjuntos de variables aleatorias en las mismas filas (especmenes, sitios). Por ejemplo, los datos morfomtricos
y ambientales recogidos en los mismos especmenes pueden ser coordinados con el fin de estudiar la covariacin entre los dos.

El programa le pedir el nmero de columnas que pertenecen al primer bloque. Las columnas restantes sern asignados al segundo
bloque. Hay opciones para el trazado de las puntuaciones de PLS tanto dentro de los bloques, y PLS cargas.

El algoritmo sigue Rohlf y Corti (2000). Pruebas de permutacin y biplots an no se implementan.

Se reparte el norte x pag matriz de datos Y dentro Y 1 y Y 2 ( los dos bloques), con pag 1 y pag 2 columnas. La matriz de correlacin o covarianza R de

Y a continuacin, se pueden particionar como

11
RRR
12
.
21
RR22

El algoritmo procede de la descomposicin de valor singular de la matriz R 12 de correlaciones entre bloques:

FR2 112DF
t
.

La matriz re contiene los valores singulares yo a lo largo de la diagonal. F 1 contiene las cargas para el bloque 1, y F 2 las cargas para el
bloque 2 (PCA cf.).

El "Squared COVAR%" es una medida de la covarianza squared general entre los dos conjuntos de variables, en porcentaje con
respecto al mximo posible (todas las correlaciones iguales a 1) (Rohlf y Corti p.
741). El "% COVAR de los ejes son las cantidades de covarianza explicada por cada PLS eje, en porcentajes de
2

la covarianza total. Se calculan como 2 100 .
ii

Faltan datos soportados por sustitucin promedio de la columna.

Referencia

Rohlf, FJ y M. Corti. 2000. El uso de dos bloques de mnimos cuadrados parciales para estudiar covariacin en forma.

Biologa sistemtica 49: 740-753.

105
Anlisis de conglomerados

La rutina de agrupacin jerrquica produce un 'dendrograma' que muestra cmo los puntos de datos (filas) se pueden agrupar. Para la agrupacin

modo de 'R', poner peso sobre agrupaciones de taxones, los taxones debe ir en filas. Tambin es posible encontrar grupos de variables o asociaciones

(modo Q), mediante la introduccin de taxones en columnas. La conmutacin entre los dos se hace mediante la transposicin de la matriz (en el men

Editar).

Tres algoritmos diferentes estn disponibles:

media de agrupamiento de pares no ponderado (UPGMA). Las agrupaciones se unen en base a la distancia media entre todos los
miembros de los dos grupos.

Solo acoplamiento (vecino ms cercano). Las agrupaciones se unen en base a la distancia ms pequea entre los dos
grupos.
el mtodo de Ward. Las agrupaciones se unen de que tal aumento en la varianza dentro de cada grupo se reduce al mnimo,

Un mtodo no es necesariamente mejor que el otro, aunque solo vnculo no se recomienda por algunos. Puede ser til para
comparar los dendrogramas dadas por los diferentes algoritmos, para evaluar informalmente la robustez de los racimos.

Para el mtodo de Ward, una medida de la distancia euclidiana es inherente al algoritmo. Para UPGMA y la vinculacin individual, la
matriz de distancia se puede calcular usando 24 ndices diferentes, como se describe en la seccin "similitud y la distancia ndices.

Datos perdidos: El algoritmo de anlisis de conglomerados puede manejar los datos faltantes, se codifica con signos de interrogacin (?). Esto se
hace usando eliminacin de pares, lo que significa que cuando la distancia se calcula entre dos puntos, ninguna de las variables que faltan se
ignoran en el clculo. Para Raup-Crick, los valores no son tratados como ausencia. Los datos que faltan no son compatibles con el mtodo de
Ward, ni para la medida de similitud Rho.

Bidireccional agrupacin: La opcin de dos vas permite simultnea agrupacin en I-mode y Q-mode.

106
Estratigrficamente limitado agrupacin: Esta opcin le permitir filas o grupos de filas adyacentes solamente a unir durante el
procedimiento de agrupamiento aglutinador. Puede provocar dendrogramas de aspecto extrao (pero correctas).

reinicializacin: Si replica se le da un nmero de bootstrap (por ejemplo 100), las columnas se someten a remuestreo. Presione INTRO
despus de actualizar el valor en el cuadro de nmero de arranque N. El porcentaje de repeticiones donde an se admite cada nodo
se da en el dendrograma.

Nota sobre el mtodo de Ward: PASADO produce dendrogramas de Ward idnticas a las realizadas por Stata, pero un tanto
diferentes de los producidos por Statistica. La razn de la discrepancia es desconocida.

107
vecino unirse

Neigbour unirse a la agrupacin (Saitou y Nei, 1987) es un mtodo alternativo para el anlisis de agrupamiento jerrquico. El mtodo fue
desarrollado originalmente para el anlisis filogentico, pero puede ser superior a UPGMA tambin para datos ecolgicos. En contraste con
UPGMA, dos ramas de un mismo nodo interno no necesita tener longitudes iguales sucursales. Se da una phylogram (dendrograma
unrooted con longitudes de rama proporcional).

ndices de distancia y bootstrapping son como para otro anlisis de conglomerados (arriba). Para ejecutar el anlisis de arranque, el tipo en el
nmero de repeticiones bootstratp requeridas (por ejemplo, 1000, 10000) en el cuadro Boot N y pulse Enter para actualizar el valor.

rama longitudes negativas se ven obligados a cero, y se transfieren a la rama adyacente de acuerdo con Kuhner y Felsenstein
(1994).

El rbol es de forma predeterminada arraigada en la ltima rama aadido durante la construccin del rbol (esto no es punto medio de enraizamiento).

Opcionalmente, el rbol puede tener sus races en cualquier fila en la matriz de datos, como seleccionado en el men raz.

Faltan datos soportados por eliminacin de pares.

referencias

Saitou, N. & M. Nei. 1987. El mtodo de unin de vecinos: un nuevo mtodo para la reconstruccin de rboles filogenticos. Molecular
Biology and Evolution 4: 406-425

108
K-means clustering

K-means clustering (por ejemplo, Bow 1984) es un mtodo de agrupamiento no jerrquico. El nmero de grupos de utilizar se especifica por el
usuario, por lo general de acuerdo con alguna hiptesis tales como hay dos sexos, cuatro regiones geogrficas o tres especies en el conjunto
de datos

Las asignaciones de racimo son inicialmente al azar. En un procedimiento iterativo, los elementos se mueven entonces a la agrupacin que tiene
la media grupo ms cercano, y los medios de racimo se actualizan en consecuencia. Esto contina hasta que los elementos ya no estn
"saltando" a otros grupos. El resultado de la agrupacin es, en cierta medida depende del pedido inicial, al azar, y por lo tanto las tareas de
racimo puede diferir de ensayo a ensayo. Esto no es un error, pero el comportamiento normal en el k-means clustering.

Las asignaciones de racimo pueden ser copiados y pegados de nuevo en la hoja de clculo principal, y los colores correspondientes (smbolos)
asignados a los elementos con los nmeros 'a colores' opcin en el men Edicin.

Faltan datos soportados por sustitucin promedio de la columna.

Referencia

Arco, S.-T. 1984. El reconocimiento de patrones. Marcel Dekker, Nueva York.

109
normalidad multivariante

normalidad multivariante es asumido por una serie de pruebas multivariantes. PASADO calcula Mardia de asimetra y curtosis multivariante, con
pruebas basadas en chi-cuadrado (asimetra) y distribuciones normales (curtosis). Tambin se da una prueba de gran alcance mnibus (general)
debido a Doornik y Hansen (1994). Si al menos una de estas pruebas muestran desviacin de la normalidad (pequea pag valor), la distribucin es
significativamente no normal. Tamao de la muestra debe ser razonablemente grande (> 50), aunque una correccin pequea muestra tambin se
trat para la prueba de asimetra.

Faltan datos soportados por sustitucin promedio de la columna.

referencias

Doornik, JA y H. Hansen. 1994. Una prueba de mnibus para la normalidad univariante y multivariante. W4 y 91 en los documentos de trabajo
Economa Nuffield.

Mardia, KV 1970. Medidas de asimetra y curtosis multivariante con las aplicaciones. Biomtrika
36: 519-530.

110
caja de METRO

Prueba para la equivalencia de las matrices de covarianza para dos o ms muestras multivariantes marcados con una columna de grupo. Esta es
una prueba para homocedasticidad, como se supone por MANOVA.

de la Caja METRO estadstica se administra junto con un valor de significacin basada en una F prueba. Tenga en cuenta que esta prueba es

supuestamente muy sensible. Esto significa que un alto pag valor ser una buena, aunque informal, indicador de la igualdad, mientras que un resultado

altamente significativo (baja pag valor) puede en la prctica ser un indicador de un poco demasiado sensible de la desigualdad.

La estadstica se calcula de la siguiente manera - en cuenta que esto es igual a la -2 ln METRO De algunos textos (Rencher 2002).

gramo

( M ) En S NGN
yo
1 En S yo

yo 1

dnde S yo son las matrices de covarianza dentro de los grupos, S es la matriz de covarianza agrupada, gramo el nmero de grupos, norte el
nmero total de filas, norte yo el nmero de filas en el grupo yo, y | | denota el determinante.

Por importancia, con r el nmero de variables aleatorias (columnas), calcular

2
rr 1
G

321 1

11116

yo 1 yo


gnngr

1 1 1 1 6
gramo
2 1

yo 1
2
GRR
2
yo
GNN

Los grados de libertad para el F prueba son entonces

111
1

RRG df 1 1 2

df 12
df 2

2
1

Finalmente,

df
df F M .
1 2

df 1

La prueba de Monte Carlo se basa en 999 permutaciones aleatorias.

Faltan datos soportados por sustitucin promedio de la columna.

Referencia

Rencher, AC 2002. Mtodos de anlisis multivariado, 2 Dakota del Norte ed. Wiley.

112
MANOVA

Unidireccional MANOVA (multivariado anlisis de varianza) es la versin multivariante de la ANOVA univariante, probando si dos o
ms grupos (especificado con una columna de grupo) tienen la misma media multivariante.

Se proporcionan dos estadsticas: lambda de Wilk con que est asociado Rao F y la traza Pillai con ella es aproximar F. lambda de Wilk
es probablemente ms comnmente utilizado, pero la traza Pillai puede ser ms robusto.

Serie de limitaciones: Para el clculo correcto de la pag los valores, el nmero de variables dependientes (restricciones) deben ser
especificadas. Normalmente debe dejarse en 0, pero para Procrustes equipado datos seal utilizan 4 (para 2D) o 6 (por 3D).

Las comparaciones por pares (post-hoc): Si el MANOVA muestra diferencia global significativa entre los grupos, el anlisis puede proceder por
comparaciones por pares. En el pasado, el anlisis post-hoc es simple, por pairwise pruebas de Hotelling. Los siguientes valores se pueden
visualizar en la tabla:

Hotelling pag valores, no corregidos para mltiples pruebas. Marcado en color rosa si es significativo ( p < 0,05).

Lo mismo pag valores, pero la significacin (rosa) evalu mediante el esquema secuencial de Bonferroni.
Bonferroni corregido pag valores (multiplicado por el nmero de comparaciones por pares). La correccin de
Bonferroni da muy poca energa.
distancias de Mahalanobis al cuadrado.

Nota: Estas comparaciones por pares utilizan la matriz de covarianza dentro del grupo agruparon en todos los grupos que participan en el
MANOVA. Por consiguiente, pueden dar ligeramente otros resultados que si slo dos de los grupos se seleccionan para su anlisis.

Faltan datos soportados por sustitucin promedio de la columna.

113
Unidireccional ANOSIM

ANOSIM (anlisis de similitudes) es una prueba no paramtrica de diferencia significativa entre dos o ms grupos, sobre la base de cualquier medida de

distancia (Clarke 1993). Las distancias se convierten en filas. ANOSIM se utiliza normalmente para los datos de taxones-en-muestras, donde los grupos

de muestras se van a comparar. Los productos que van en filas, variables aleatorias en las columnas, y los grupos deben especificarse con una columna

de grupo como de costumbre.

En una analoga aproximada con ANOVA, la prueba se basa en la comparacin de las distancias entre los grupos con distancias dentro de los grupos.

Dejar r segundo el rango promedio de todas las distancias entre los grupos, y r w el rango promedio de todas las distancias dentro de los grupos. La

estadstica de prueba R se define entonces como

Rwb
rr .
NN 1 4

grande positivo R ( hasta 1) significa disimilitud entre los grupos. La importancia de una cola se calcula por
permutacin de pertenencia al grupo, con 9.999 rplicas (se puede cambiar).

Pairwise ANOSIMs entre todos los pares de grupos se proporcionan como una prueba post-hoc. comparaciones significativas (en p < 0,05) se
muestran en color rosa. La correccin de Bonferroni opcional multiplica la pag valores con el nmero de comparaciones. Esta correccin es
muy conservador (produce grandes pag valores). La opcin secuencial de Bonferroni no corregida de salida pag valores, pero la significacin se
decide en base a paso hacia abajo secuencial de Bonferroni, que es un poco ms potente que la simple Bonferroni.

Faltan datos soportados por eliminacin de pares (no para la Raup-Crick, Rho y los ndices definidos por el usuario).

Referencia

Clarke, KR anlisis multivariante de 1993. no paramtricos de los cambios en la estructura de la comunidad.


Diario australiano de Ecologa 18: 117-143.

114
Unidireccional PERMANOVA

NPMANOVA (no paramtrico MANOVA, tambin conocido como PERMANOVA) es una prueba no paramtrica de diferencia significativa entre dos o
ms grupos, sobre la base de cualquier medida de distancia (Anderson, 2001). NPMANOVA se utiliza normalmente para datos ecolgicos
taxones-en-muestras, donde los grupos de muestras se van a comparar, pero tambin puede ser utilizado como un MANOVA general no paramtrico.

Los productos que van en filas, variables aleatorias en las columnas, y los grupos deben especificarse con una columna de grupo.

NPMANOVA calcula una F valor en analoga con ANOVA. De hecho, para los conjuntos de datos univariados y la medida de la
distancia euclidiana, NPMANOVA es equivalente a ANOVA y da la misma F valor.

La significacin se calcula por permutacin de pertenencia al grupo, con 9.999 rplicas (puede ser cambiado por el usuario).

Pairwise NPMANOVAs entre todos los pares de grupos se proporcionan como una prueba post-hoc. comparaciones significativas (en p < 0,05) se
muestran en color rosa. La correccin de Bonferroni se muestra en el tringulo superior de la matriz multiplica la pag valores con el nmero de
comparaciones. Esta correccin es muy conservador (produce grandes pag valores).

Faltan datos soportados por eliminacin de pares.

Referencia

Anderson, MJ 2001. Un nuevo mtodo para el anlisis multivariante no paramtrico de la varianza. Ecologa Austral 26: 32-46.

115
Bidireccional ANOSIM

El ANOSIM de dos vas en el pasado utiliza el diseo cruzado (Clarke 1993). Para obtener ms informacin, vase unidireccional ANOSIM, pero
se requieren dos columnas de grupo. Debe haber varias filas (replicacin) para cada combinacin de niveles de grupo.

Referencia

Clarke, KR anlisis multivariante de 1993. no paramtricos de los cambios en la estructura de la comunidad.


Diario australiano de Ecologa 18: 117-143.

Bidireccional ANOSIM sin replicacin

se requieren datos de entrada como para la de dos vas ANOSIM anteriormente, es decir dos columnas de grupo. Debe haber exactamente una

fila (sin replicacin) para cada combinacin de niveles de grupo.

Referencia

Clarke, KR y Warwick, RM 1994. Las pruebas basadas en similitud para el patrn de la comunidad: el diseo de dos vas sin
replicacin. Biologa Marina 118: 167-176.

116
Bidireccional PERMANOVA
El dos vas NPMANOVA (Anderson, 2001) en el pasado utiliza el diseo cruzado. El diseo debe ser equilibrada, es decir, cada combinacin de
niveles debe contener el mismo nmero de filas. Para obtener ms informacin, vase unidireccional NPMANOVA, pero se requieren dos
columnas de grupo (como por dos vas ANOSIM).

Referencia

Anderson, MJ 2001. Un nuevo mtodo para el anlisis multivariante no paramtrico de la varianza. Ecologa Austral 26: 32-46.

117
prueba de Mantel y prueba de Mantel parcial

La prueba de Mantel (Mantel 1967, Mantel y Valand 1970) es una permutacin de prueba para la correlacin entre dos matrices de distancia o de
similitud. En el pasado, estas matrices tambin se pueden calcular de forma automtica a partir de dos conjuntos de datos original. La primera
matriz debe estar por encima de la segunda matriz en la hoja de clculo, y las filas se especifica como dos grupos (con una columna de grupo). Las
dos matrices deben tener el mismo nmero de filas. Si son de distancia o similaridad matrices, sino que tambin deben tener el mismo nmero de
columnas.

los R valor es simplemente coeficiente de correlacin de Pearson entre todas las entradas de las dos matrices (porque las matrices son

simtricas que slo es necesario correlacionar los tringulos inferiores). Se extiende de -1 +1. La permutacin de prueba compara el

original R a R calculado en, por ejemplo 9999 permutaciones aleatorias. el informaron pag valor es de una cola.

En el siguiente ejemplo, la primera matriz (gpa) se compone de coordenadas seal armarios-Procrustes de crneos de primates, mientras que
la segunda matriz (SEC) contiene datos de la secuencia de los mismos primates. El usuario ha seleccionado la medida euclidiana para la
primera matriz, y Jukes-Cantor para la segunda. Los dos conjuntos de datos parecen estar correlacionados negativamente ( R = - 0,19), y no
existe una correlacin positiva significativa (la prueba es de una cola). En otras palabras, no existe una correlacin entre la morfologa y la
gentica.

118
prueba parcial de Mantel

Es posible aadir una tercera matriz do por debajo de las dos matrices UN y segundo como se describi anteriormente. Esta matriz debe ser marcado como

anteriormente, y contiene el mismo nmero de filas como UN y SEGUNDO. Una medida de similitud separada entonces se puede seleccionar para esta

matriz. Si se incluye una tercera matriz tal, el programa llevar a cabo una prueba de Mantel parcial para la correlacin de UN y SEGUNDO, controlar por

similitudes dadas en do

(Legendre y Legendre, 1998). Slo matriz UN se permutado, y el R valor se calcula como

C AB
AC AB RRR
BC
R
2 11 2
R C.A. R antesde Cristo

dnde R ( AB) es el coeficiente de correlacin entre UN y SEGUNDO.

referencias

Legendre, P. & L. Legendre. 1998. Ecologa numrica, 2 ed Ingls. Elsevier, 853 pp.

Mantel, N. 1967. La deteccin de la agrupacin de la enfermedad y un enfoque de regresin generalizada. Investigacin sobre el cncer 27: 209-220.

Mantel, N. & RS Valand 1970. Una tcnica de anlisis multivariante no paramtrico. biometra
26: 547-558.

119
SONRISA BOBA

SIMPER (porcentaje de similitud) es un mtodo simple para la evaluacin de que taxones son los principales responsables de una diferencia
observada entre los grupos de muestras (Clarke 1993). El significado general de la diferencia a menudo es evaluada por ANOSIM. La medida
de similitud de Bray-Curtis (multiplicado por 100) es ms comnmente utilizado con SIMPER, pero la euclidiana, coseno y medidas acordes
tambin se puede utilizar.

Si se seleccionan ms de dos grupos, puede comparar los dos grupos (pares) por la eleccin de las listas de grupos, o puede reunir
todas las muestras para llevar a cabo un grupo de mltiples SIMPER general. En el ltimo caso, todos los posibles pares de muestras
se compararon mediante la medida Bray-Curtis. La disimilitud promedio global se calcula utilizando todos los taxones, mientras que las
diferencias taxn se calculan para cada taxn individual.

Las muestras van en filas, agrupados con una columna de grupo, y taxones en columnas. En la tabla de resultados, los taxones se clasifican en orden

descendente de la contribucin a diferencia de grupo. Las tres ltimas columnas muestran la abundancia media en cada uno de los grupos.

Faltan datos soportados por sustitucin promedio de la columna.

Referencia

Clarke, KR anlisis multivariante de 1993. no paramtricos de los cambios en la estructura de la comunidad.


Diario australiano de Ecologa 18: 117-143.

120
Emparejado Hotelling

La prueba de Hotelling emparejado espera dos grupos de datos multivariados, marcados con una columna de grupo. Las filas dentro de cada
grupo deben ser consecutivos. La primera fila del primer grupo se empareja con la primera fila del segundo grupo, la segunda fila est
emparejado con el segundo, etc.

Con norte el nmero de pares y pag el nmero de variables:

1
XXY
2 iii

y Y yo

yo
11


T
S y
yo
Y Yyo
Y Y
nn 1 yo

2 y T 1
T n Sy y

pn
F
2
T
np
1 ( )

los F tiene pag y notario pblico grados de libertad.

por n <= 16, el programa tambin calcula una exacta pag valor basado en el T 2 Estadstica evaluado para todas las permutaciones posibles.

Faltan datos soportados por sustitucin promedio de la columna.

121
Tcnica analgica moderna

La tcnica moderna Analog es un mtodo de calibracin para la reconstruccin de un parmetro ambiental pasado (por ejemplo, temperatura) de
assosications de fauna. Funciona mediante la bsqueda de sitios modernas con asociaciones faunsticas cercanos a los de las muestras
downcore. Los datos ambientales de los sitios modernos se utilizan para estimar el downcore medio ambiente.

La (nica) variable ambiental, por lo general la temperatura, entra en la primera columna, y taxones en columnas consecutivas. Todos los
sitios modernos, con valores conocidos para la variable ambiental, van en las primeras filas, seguido por todas las muestras downcore
(stos deben tener signos de interrogacin en la columna del medio ambiente).

La trama en la primera pestaa muestra todas las muestras modernas, con la temperatura observada (por ejemplo) frente a la temperatura
MAT reconstruido utilizando licencia-un-out validacin cruzada (jackknifing).

Parmetros para configurar:

Ponderacin: Cuando varios anlogos modernos estn vinculados a una muestra downcore, sus valores ambientales pueden ser

ponderados por igual, inversamente proporcional a la distancia de la fauna, o inversamente proporcional a la distancia de la fauna

clasificado.

medida de distancia: Varias medidas de distancia utilizadas comnmente en MAT estn disponibles. "Acorde al cuadrado" se ha
convertido en la opcin estndar en la literatura.
umbral de distancia: Slo se utilizan anlogos modernos ms estrechas que este umbral. Se da un valor predeterminado, que es el
dcimo percentil de las distancias entre todos los pares de muestras en los datos modernos. El histograma "distribucin de
disimilaridad" puede ser til en la seleccin de este umbral.
N anlogos: Este es el nmero mximo de anlogos modernos usados para cada muestra downcore.
Mtodo de salto (on / off): Para cada muestra downcore, muestras modernas estn ordenadas segn la distancia ascendente.
Cuando la distancia aumenta en ms del porcentaje seleccionado, los anlogos modernos posteriores se descartan.

122
Tenga en cuenta que una o ms de estas opciones puede ser desactivada mediante la introduccin de un valor grande. Por ejemplo, un umbral de

distancia muy grande no se aplicar, por lo que se decide el nmero de anlogos slo por el valor de "N anlogos" y, opcionalmente, el mtodo de salto.

Validacin cruzada

El grfico de dispersin y R 2 valor de mostrar los resultados de una licencia-un-out (jackknifing) validacin cruzada dentro de los datos
modernos. los y = x lnea se muestra en rojo. Esto refleja slo en parte la "calidad" del mtodo, ya que da poca informacin sobre la precisin
de la estimacin downcore.

distribucin de disimilitud

Un histograma de todas las distancias en los datos de ncleo superior (moderna).

semivariograma

Muestra un semivariograma de la varianza de la variable ambiental como una funcin de la diferencia de fauna. Varios modelos pueden ser
equipados semivariogram. Este tipo de trama es familiar de la geoestadstica espaciales, pero tambin es til para MAT porque da una buena
impresin del grado de ruido en los datos sobre la fauna con respecto a la prediccin del medio ambiente.

reconstrucciones

Reconstruccin de los valores paleoambientales utilizando MAT.

123
Los ndices de similitud y de distancia
Calcula una serie de medidas de similitud o de distancia entre todos los pares de filas. Los datos pueden ser multivariante univariado o (ms
comnmente), con variables en columnas. Los resultados se dan como una matriz de similitud / distancia simtrica. Este mdulo se usa raramente,
porque matrices similitud / distancia son generalmente calculan automticamente a partir de los datos primarios en mdulos tales como PCO,
NMDS, anlisis de conglomerados y ANOSIM en el pasado.

euclidiana

distancia eucldea bsica (el valor se ajusta a los datos que faltan).


2
jk
ki xxd
ji

yo .

Gower

Una medida de la distancia que los promedios la diferencia sobre todas las variables, cada trmino normalizado para el rango de esa variable:

ki xxji
jk
Norte
del
Dakota
max 1
min xxsi
yo Si
s s .

La medida Gower es similar a la distancia Manhattan (vase ms adelante), pero con la normalizacin gama. Al usar tipos de datos
mixtos (ver abajo), esto es la medida predeterminada para los datos continuos y ordinales.

Acorde

distancia eucldea entre vectores normalizados. Comnmente utilizado para los datos de abundancia. Puede escribirse como

xx
ki ji

re jk 2 2


2 2
i ji
xxki
yo yo
.

Manhattan

La suma de las diferencias de cada variable:

jk
ki xxd
ji
yo .

Bray-Curtis

124
Bray-Curtis es un ndice de similitud popular para los datos de abundancia. Pasado calcula Bray-Curtis similitud de la siguiente manera:

ki xxji
re 1 .

jk ji i
xxki
yo

Esto es algebraicamente equivalente a la forma dada originalmente por Bray y Curtis (1957):

min 2 , kixxji
re jk .
xxki
ji i

yo

Muchos autores operan con una distancia de Bray-Curtis, que es simplemente 1- re.

Coseno

El producto interno de abundancias cada normalizados a norma unidad, es decir, el coseno del ngulo entre los vectores.

xx
ki ji

re jk


2 2
i ji
xxki
yo yo
.

Morisita

Para los datos de abundancia.

jixxji 1
1


i ji
xxJi 1
yo yo

kixxki 1

2


ki i
xxki 1
yo yo

2 ki ji

re jk
1 2 i ji xxxx
ki
yo yo .

cuerno

125
ndice de Horn en paralelo de los datos de abundancia (Horn 1966).

j
N x Ji
yo

k
N x ki
yo

Enki jiji ki
Enji ji
En
ki
xxxxxxxxd
ki
yo yo

En
jk

ln ln NNNNNNNN
.
kkjjkjkji

Mahalanobis

Una medida de la distancia teniendo en cuenta la estructura de covarianza de los datos. Con S la matriz de varianzascovarianzas:

.
T 1
re jk kj
S xx xxkj

Correlacin

El complemento 1- r de Pearson r la correlacin entre las variables:


ki j ji

xxxx
k

re jk
1
ji i


2 2
j
k xxxx
ki

yo
.

Tomando el complemento hace que esta una medida de distancia. Vase tambin el mdulo de correlacin, donde Pearson r se le da forma
directa y con pruebas de significacin.

Rho

El complemento 1- r s de rho de Spearman, que es el coeficiente de correlacin de rangos. Vase tambin el mdulo de correlacin, donde
se da Rho directamente y con pruebas de significacin.

Dado

Tambin conocido como el coeficiente de Sorensen. Para los datos binarios (ausencia-presencia), codificado como 0 o 1 (cualquier nmero positivo

se trata como 1). La similitud de los dados pone ms peso sobre ocurrencias conjuntas que en desajustes.

Al comparar dos filas, un partido se cuenta para todas las columnas con presencias en ambas filas. Utilizando METRO
para el nmero de coincidencias y norte para el nmero total de columnas con presencia en una sola fila, tenemos

126
re jk = 2 M / ( 2 M + N).

Jaccard

Un ndice de similitud para los datos binarios. Con la misma notacin que dada la similitud de los dados anteriormente, tenemos

re jk = M / (M + N).

Kulczynski

Un ndice de similitud para los datos binarios. Con la misma notacin que da para Dice similitud anteriormente (con norte 1

y norte 2 refirindose a las dos filas), tenemos

METRO MNM

Nuevo
Mjico 2

1
re jk
2 .

Ochiai

Un ndice de similitud para los datos binarios, comparable a la similitud coseno para otros tipos de datos:

Md MNM
jk

Nuevo
Mjico
1
.
2

Simpson

El ndice de Simpson (Simpson 1943) se define simplemente como M / N min, dnde norte min es el ms pequeo de los nmeros de presencias en las
dos filas. Este ndice trata dos filas como idntico si uno es un subconjunto de la otra, por lo que es til para los datos fragmentarios.

Raup-Crick

ndice Raup-Crick para datos ausencia de presencia. Este ndice (Raup y Crick 1979) utiliza un procedimiento (Monte Carlo),
comparando el nmero observado de especies ocurring en ambas asociaciones con la distribucin de co-ocurrencias de 1000
repeticiones al azar de la piscina de muestras de la aleatorizacin.

Hamming

Hamming distancia para los datos categricos como estar con nmeros enteros (o secuencia de datos codificados como CAGT). La distancia
Hamming es el nmero de diferencias (desajustes), de modo que la distancia entre (3,5,1,2)

127
y (3,7,0,2) es igual a 2. En el pasado, esto es normalizada a la gama [0,1], que se sabe que los genetistas como "p-distancia".

Jukes-Cantor

medida de la distancia para los datos de secuencias genticas (CAGT). Similar a pag ( o Hamming) distancia, pero tiene en cuenta la probabilidad
de reversiones:


re
pag
4 1 ln 4 3
3

Kimura

El Kimura 2-parmetro medida de distancia para los datos de secuencias genticas (CAGT). Similares a Jukes-Cantor distancia, pero tiene en
cuenta las probabilidades diferentes de transiciones de nucletidos vs. transversiones (Kimura 1980). Con PAG la proporcin observada de las
transiciones y Q el nmero observado de transversiones, tenemos

re QP
1 ln 412 1 2 1 ln 2 Q
.

Tajima-Nei

medida de la distancia para los datos de secuencias genticas (CAGT). Similar a Jukes-Cantor distancia, pero no asume frecuencias iguales
de nucletidos.

Tamura

medida de la distancia para los datos de secuencias genticas (CAGT). Una extensin de la Kimura 2-parmetro de distancia, la manipulacin
desigual probabilidad de transicin / transversin, pero tambin tiene en cuenta un posible sesgo en la frecuencia de G + C. Con PAG y Q como para
Kimura distancia, y h = 2 (1- ) donde es la frecuencia de G + C (0-1):


ln 1 h Q h Phd 1 21
1 ln 2Q

Geogrfico

Distancia en metros a lo largo de un gran crculo entre dos puntos de la superficie de la Tierra. se requieren Exactamente dos variables (columnas),
con las latitudes y longitudes en grados decimales (por ejemplo, 58 grados 30 minutos Norte es 58,5). Se espera que las coordenadas en el punto
de referencia WGS84, y la distancia se calcula con respecto al elipsoide WGS84. El uso de otros puntos de referencia dar lugar a errores muy
leves.

La precisin del algoritmo utilizado (Vincenty 1975) es del orden de 1 mm con respecto a WGS84.

128
similitud definido por el usuario

Espera una matriz de similitud simtrica en lugar de datos originales. Sin comprobacin de errores!

distancia definida por el usuario

Espera una matriz de distancia simtrica en lugar de datos originales. Sin comprobacin de errores!

Mezclado

Esta opcin requiere que los tipos de datos han sido asignados a las columnas (vase La entrada y la manipulacin de datos). Una ventana
emergente le pedir la medida de similitud / distancia a utilizar para cada tipo de datos. Estos se combinan utilizando un promedio ponderado por el
nmero de variables aleatorias de cada tipo. Las opciones por defecto se corresponden a los sugeridos por Gower, pero otras combinaciones
tambin pueden funcionar mejor. La opcin de "Gower" es una distancia Manhattan gama-normalizado.

filas todos ceros: Algunas medidas de similitud (Dice, Jaccard, Simpson, etc.) no estn definidos cuando se comparan dos filas de todo ceros. Para
evitar errores, especialmente cuando bootstrapping conjuntos de datos dispersos, la similitud se establece en cero en estos casos.

Datos perdidos: La mayora de estas medidas tratan los datos que faltan (codificado como '?') Por eliminacin de pares, lo que significa que
si se pierde un valor en una de las variables en un par de filas, esa variable se omite del clculo de la distancia entre las dos filas . Las
excepciones son distancia rho, utilizando sustitucin promedio de la columna, y Raup-Crick, que trata los datos que faltan como cero.

referencias

Bray, JR y JT Curtis. 1957. Una ordenacin de las comunidades de los bosques de tierras altas del sur de Wisconsin. Monografas ecolgicos
27: 325-349.

Cuerno, SA 1966. Medicin de la superposicin en los estudios ecolgicos comparativos. American Naturalist
100: 419-424.

Kimura, M. 1980. Un modelo sencillo para la estimacin de las tasas de evolucin de las sustituciones de bases a travs de estudios
comparativos de secuencias de nucletidos. Journal of Molecular Evolution 16: 111-120.

Raup, D. & RE Crick. 1979. La medida de similitud faunstica en la paleontologa. Diario de Paleontologa 53:
1213-1227.

Simpson, GG 1943. Los mamferos y la naturaleza de los continentes. American Journal of Science 241: 1-31.

Vincenty, T. 1975. directa y soluciones inversas de geodsicas en el elipsoide con aplicacin de las ecuaciones anidadas. Revisin

encuesta 176: 88-93.

129
Estadsticas secuencia gentica

Un nmero de estadsticas simples en secuencia gentica (ADN o ARN) de datos. El mdulo espera que un nmero de filas, cada una con una

secuencia. Se espera que las secuencias de estar alineados y de igual longitud incluyendo huecos (codificados como '?'). Algunas de estas estadsticas

son tiles para la seleccin de medidas de distancia apropiadas en otro lugar en el pasado.

Largo total: La longitud de la secuencia total, incluyendo huecos, de una secuencia

brecha promedio: El nmero de posiciones Gap, como media de todas las secuencias de

Media de A, T / T, C, G: El nmero medio de posiciones que contiene cada nucletido

Promedio pag distancia: los pag distancia entre dos secuencias, promediado sobre todos los pares de secuencias. los pag ( o
Hamming) distancia se define como la proporcin de posiciones desiguales

Media de Jukes-Cantor re: El Jukes-Cantor re distancia entre dos secuencias, promediado sobre todos los pares de
secuencias. d = - 3LN (1 - 4 pag/ 3) / 4, donde pag es el pag distancia

La mxima Jukes-Cantor re: Maximal distancia Jukes-Cantor entre dos secuencias

(Promedio de transiciones PAG): Promedio del nmero de transiciones (ag, ct, es decir, dentro purinas, pirimidinas)

transversiones promedio ( Q): Nmero medio de transversiones (at, ac, cg, tg, es decir, a travs de purinas,
pirimidinas)

R = P / Q: La relacin de transicin / transversin

Datos perdidos: Tratada como huecos.

130
modelo de men

Lineal, bivariante

Si se seleccionan dos columnas, que representan x y y valores, respectivamente. Si se selecciona una columna, que representa y valores, y x valores
se toman para ser la secuencia de nmeros enteros positivos (1,2, ...). Una lnea recta y = ax + b est ajustada a los datos. Varios conjuntos de datos
bivariados pueden ser una regresin en la misma parcela, y sus pendientes compararon, dando un nmero par de columnas, cada par de columnas
que se un conjunto xy.

Hay cuatro diferentes algoritmos disponibles: mnimos cuadrados ordinarios (MCO), la reduccin Eje mayor (RMA), Eje mayor (MA), y robusto.
regresin por mnimos cuadrados asume la x Los valores son fijos, y encuentra la lnea que minimiza los errores al cuadrado en el y valores.
Utilice esta opcin si su x Los valores tienen muy poco error asociado con ellos. RMA y MA tratan de minimizar tanto el x y el y errores. RMA / MA
apropiado, la estimacin de error estndar y la comparacin de pendiente son de acuerdo a Warton et al. ( 2006).

El mtodo robusto es un modelo avanzado I (fijo x valores) de regresin que es robusto a los valores atpicos. A veces da resultados extraos,
pero puede ser muy exitoso en el caso de errores casi distribucin normal pero con algunos valores lejanos. El algoritmo es Least Squares
Serrano, basada en el cdigo FastLTS de Rousseeuw y Driessen (1999). estimaciones de los errores paramtricos no estn disponibles,
pero Pasado da intervalos de confianza bootstrap en pendiente y la interseccin (cuidado - esto es extremadamente lento para grandes
conjuntos de datos).

Ambos x y y valores pueden ser transformado logartmicamente (base 10), en efecto apropiado sus datos a la funcin de 'alomtrico' y = 10 segundo x a. Un

un valor en torno a 1 indica que una lnea recta ( 'isomtrica') de ajuste puede ser ms aplicable.

Los valores para un y segundo, sus errores, Pearson r correlacin, y la probabilidad de que las columnas son
no correlacionada se dan. Nota la r 2 es simplemente el coeficiente de Pearson cuadrado - no se ajusta para el mtodo de regresin.

131
El clculo de los errores estndar de pendiente y la interseccin asume una distribucin normal de los residuales y la independencia
entre las variables y la varianza de los residuales. Si estas suposiciones estn fuertemente violados, es preferible utilizar los intervalos
de confianza del 95 por ciento de bootstrap (1999 repeticiones).

La prueba de permutacin en la correlacin ( r 2) utiliza 9.999 repeticiones.

banda de confianza

En el modelo de regresin (no RMA / MA / Robusta), un 95 por ciento "Trabajo de Hotelling" banda de confianza para la lnea de ajuste (no para los
puntos de datos!) Est disponible. La banda de confianza se calcula como

1
XXII
2
SE t ax b 2

CI 2 reg

/, 052norte
yo xx

0. 2


2 2
donde la suma de los residuales al cuadrado reg
deyoSE
hacha
yo
.

Cuando el punto de interseccin se fuerza a cero, la banda de confianza se calcula como

CI reg
.

0.
/, 052norte
SE t hacha2 2 1 2
xxyo

intercepto cero

Fuerza la lnea de regresin a travs de cero. Esto tiene implicaciones tambin para el clculo de la pendiente y el error estndar de la pendiente.
Los cuatro mtodos de manejar esta opcin.

132
Derechos residuales de autor

La ventana Residuales informa las distancias desde cada punto de datos a la lnea de regresin, en el x y
y direcciones. Slo este ltimo es de inters cuando se usa la regresin lineal ordinaria en lugar de RMA o MA. Los residuos pueden ser
copiados de vuelta a la hoja de clculo y se inspeccionan para la distribucin normal y la independencia entre la variable independiente y
la varianza residual (homocedasticidad).

prueba de Durbin-Watson

La prueba de Durbin-Watson para autocorrelacin positiva de los residuos en y ( viola la suposicin de regresin OLS) se da en la ventana
Residuales. La estadstica de prueba vara de cero (autocorrelacin positiva total) a travs de 2 (cero autocorrelacin) a 4
(autocorrelacin negativa). por n <= 400, una exacta pag valor para no autocorrelacin positiva se calcula utilizando el algoritmo de PAN
(Farebrother 1980, con correcciones posteriores). La prueba no es exacta cuando se utiliza la opcin cero intercepcin.

Breusch-Pagan

La prueba Breusch-Pagan para heteroscedasticidad, es decir, la varianza no estacionario de los residuos (que violen la asuncin de regresin
OLS) se da en la ventana Residuales. La estadstica de prueba es LM = nr 2 dnde r
es el coeficiente de correlacin entre la x los valores y los residuos al cuadrado. Se distribuye asintticamente como 2 con un
grado de libertad. La hiptesis nula de la prueba es de homocedasticidad.

Funciones exponenciales

Sus datos se pueden ajustar a una funcin exponencial y = e segundo mi hacha por primera transformacin logartmica slo su y columna (en el men
Transform) y luego realizar un ajuste de lnea recta.

ecuaciones RMA


2
yyra

Cuesta abajo firmar .
2
xx

2
RAA
error estndar de .
1 abs
2
norte

Interceptar xayb
.

22
2

r
error estndar de sxnsb
un
, dnde s r es la estimacin de la desviacin estndar de los residuales y s un es

el error estndar de la pendiente.

Para cero de intercepcin ( b = 0), conjunto x 0 y y 0 para el clculo de la pendiente y su error estndar
(Incluyendo el clculo de r en el mismo), y el uso norte- 1 en lugar de norte- 2 para el clculo del error estndar.

Los datos que faltan: Con el apoyo de la fila eliminacin.

133
referencias

Farebrother, procedimiento RW 1980 de Pan para las probabilidades de la cola de la estadstica de Durbin-Watson.
Estadsticas aplicadas 29: 224-227.

Rousseeuw, PJ & van Driessen, K. 1999. Computing LTS de regresin para grandes conjuntos de datos. Instituto de Matemtica Boletn de
Estadsticas.

Warton, DI, Wright, IJ, Falster, DS y Westoby, M. 2006. mtodos-lnea de adaptacin bivariados para alometra. Revisin
biolgica 81: 259-291.

134
Linear, multivariado (uno independiente, n dependiente)

Cuando tiene una variable aleatoria independiente y varias variables aleatorias dependientes, puede adaptarse a cada variable aleatoria depende por

separado a la variable independiente mediante regresin lineal simple. Este mdulo hace que el proceso ms conveniente por tener un botn de

desplazamiento pasando por cada una variable aleatoria dependiente.

El mdulo de espera de dos o ms columnas de datos medidos, con la independiente en la primera columna y las
dependientes en columnas consecutivas.

Adems, se proporciona una prueba general MANOVA de significacin de regresin multivariante. estadstica de prueba lambda El Wilks' se
calcula como la relacin de los determinantes

,
HEE

dnde mi es la suma de errores (residuales) de cuadrados y productos cruzados, y MARIDO es la suma hiptesis (predicciones) de cuadrados
y productos cruzados. del Rao F estadstico se calcula a partir de lambda la Wilks' y se somete a una de una cola F de prueba (ver 'lineal, n
independiente, n dependiente' a continuacin).

Faltan datos soportados por sustitucin promedio de la columna.

Regresin para morhpometrics geomtricas

Para puntos de referencia de armarios-Procrustes o coeficientes de Fourier elptica como las variables dependientes, ver el men de geometra para

la regresin con la visualizacin de cambio de forma.

135
Linear, mltiple (un dependiente, n independiente)
Dos o ms columnas de datos medidos, con la dependiente en la primera columna y los independientes en
columnas consecutivas.

El programa presentar el coeficiente de correlacin mltiple R y R 2, junto con el "ajustado"


R 2 y una prueba de significacin de tipo ANOVA.

Con SSR la suma de cuadrados de regresin, SSE la suma de errores (residuales) de cuadrados, norte el nmero de puntos y k el nmero de

variables aleatorias independientes, tenemos R 2 = SSR / SST,

2 R n
2

R adj ,
1 kn 111

k
SSR F
.
SSE kn1( )

Los coeficientes (intercepto y pendiente para cada variable aleatoria independiente) se presentan con sus errores estndar
estimados y pruebas t.

Faltan datos soportados por sustitucin promedio de la columna.

136
Linear, mltiple multivariante (m independiente, n dependiente)
Requiere dos o ms columnas de datos medidos, con las variables dependientes en la primera columna (s) y los independientes en

columnas consecutivas. El programa le pedir el nmero de variables dependientes. La salida consta de cuatro partes principales.

MANOVA general

Una prueba de significacin global de regresin multivariante. estadstica de prueba lambda El Wilks' se calcula como la relacin de los

determinantes

,
HEE

dnde mi es la suma de errores (residuales) de cuadrados y productos cruzados, y MARIDO es la suma hiptesis (predicciones) de

cuadrados y productos cruzados.

del Rao F estadstico se calcula a partir de la lambda de Wilks. Con norte el nmero de filas, pag el nmero de variables dependientes

y q el nmero de variables independientes, tenemos:

2 1 1 1
qpqnm

2 2
QP
54 2 2
si qpqp
5 0

2 2


1 de otra manera

1
1 m 1pq 2
F 1

pq

Tenga en cuenta que Rao F puede llegar a ser negativo. los F prueba tiene pq y metro + 1- pq / 2 grados de libertad.

Las pruebas en las variables independientes

La prueba para el efecto global de cada variable independiente (en todas las variables dependientes) se basa en un diseo similar como

el MANOVA general anterior, pero la comparacin de los residuales de regresin con y sin la variable independiente en cuestin.

Las pruebas en las variables dependientes

Ver 'lineal, n independiente, un dependiente' por encima de los detalles de las pruebas de ANOVA para el efecto global de todas las variables

independientes en cada dependiente.

Los coeficientes de regresin y estadsticas

El conjunto completo de coeficientes y sus significados para todas las combinaciones de variables independientes y dependientes.

Faltan datos soportados por sustitucin promedio de la columna.

137
Modelo Lineal Generalizado

Este mdulo calcula una versin bsica del modelo lineal generalizado, por una sola variable explicativa. Se requiere dos
columnas de datos (variables dependientes e independientes).

GLM permite distribuciones no normales, y tambin transformacin del modelo a travs de una funcin de enlace. Algunas
combinaciones particularmente tiles de la distribucin y la funcin de enlace son:

distribucin normal y el enlace de la identidad: Esto es equivalente a ordinaria regresin de mnimos cuadrados lineal.

distribucin normal y el enlace recproco: Ajustar a la funcin y = 1 / ( ax + b).

distribucin normal o gamma y el enlace de registro: Ajustar a la funcin y = exp ( ax + b).

Binomial (Bernoulli) de distribucin y el enlace logit: La regresin logstica para una variable de respuesta binaria (vase la figura anterior).

Detalles tcnicos

El programa utiliza el algoritmo iterativamente reponderadas mnimos cuadrados (IRLS) para la estimacin de mxima verosimilitud.

El parmetro de dispersin , que se utiliza slo para la inferencia, no la estimacin de parmetros, se fija en = 1 para la Poisson y
distribuciones binomiales. Para las distribuciones normales y gamma, se estima usando chi-cuadrado de Pearson.

D
El diario de probabilidad LL se calcula a partir de la desviacin re por LL .
2

138
La desviacin se calcula como sigue:


2
Normal: D y ii
yo

yy

ii
Gama: re 2 ln
yo ii
yo

D aaaa
Bernoulli:


1 ln 1 ln 2
yo

1

ii
(El primer trmino define como cero si y i = 0)
yo iii


Poisson: 2 Dln

yyy
iiiii
yo

los GRAMO estadstica es la diferencia de re entre el modelo completo y una ejecucin de GLM adicional donde slo se monta la interseccin. GRAMO

es aproximadamente ji cuadrado con un grado de libertad, dando un significado para la pendiente.

139
regresin polinmica

Dos columnas deben ser seleccionados ( x y y valores). Un polinomio de hasta el quinto orden es ajustada a los datos. El algoritmo se basa
en un criterio de mnimos cuadrados y la descomposicin de valor singular (Press et al. 1992), con media y varianza de normalizacin
para mejorar la estabilidad numrica.

El polinomio est dada por


122334455
axaxaxaxaxay
0
.

El valor de ji cuadrado es una medida de error apropiado - valores mayores significan peor ajuste. El Criterio de Informacin de Akaike tiene una
penalizacin por el nmero de trminos. El AIC debe ser lo ms bajo posible para maximizar el ajuste, pero evitar el sobreajuste.

R 2 es el coeficiente de determinacin, o la proporcin de la varianza explicada por el modelo. Por ltimo, una pag
valor, en base a una F prueba, da el significado de la forma.

Referencia

Prensa, WH, SA Teukolsky, WT Vetterling y BP Flannery. 1992. Numerical Recipes en C. Cambridge University Press.

140
no lineal

Intentos de ajuste de dos columnas de datos XY para una serie de ecuaciones no lineales, utilizando los mnimos cuadrados. Seleccione un nombre de

funcin de la lista. Para ver ms funciones, agarra un nombre de funcin y arrastre hacia arriba y hacia abajo para desplazarse.

Los intervalos de confianza del 95% se basan en 1999 repeticiones de arranque.

Montaje de una funcin no lineal puede ser un poco complicado. Para la mayora de las funciones, Pasado utiliza una conjetura para los parmetros,

seguido de Levenberg-Marquardt optimizacin. Tenga en cuenta que el algoritmo LM se ha mejorado respecto a versiones anteriores del pasado, por

lo que los resultados pueden diferir ligeramente.

El criterio de informacin Akaike (AIC) puede ayudar en la seleccin de modelo. Los valores ms bajos para el AIC implican un mejor ajuste,
ajustado por el nmero de parmetros.

Lineal

yb
hacha

Incluido para la comparacin con las funciones no lineales. Fitting por regresin de mnimos cuadrados ordinaria.

Cuadrtico

2
bx ax y c

Incluye como referencia. Fitting por mnimos cuadrados y SVD (la ecuacin es lineal en sus coeficientes).

141
Poder

segundo
hacha y c

La ecuacin de la ley de potencia habitual. conjetura inicial por transformacin log-log y la regresin lineal (es decir, c =

0), seguido de optimizacin no lineal.

Exponencial

bx
ae y c

conjetura inicial por linealizacin (log-transformacin y), seguido de optimizacin no lineal.

von Bertalanffy


ay1 ser
cx

Esta ecuacin se utiliza para modelar el crecimiento de los animales multicelulares (Brown & Rothery 1993). A veces se da en una
forma ligeramente diferente:

L y 1 e
K tx0

Es fcil ver que


L una, K =cy 0 En .
CBT

El valor de un se estima por primera vez por el valor mximo de Y, y segundo y do usando un ajuste de la recta a un modelo linealizado.
Finalmente optimizacin no lineal.

De Michaelis-Menten


eje Y xb

La curva de Michaelis-Menten puede hacer ajustes precisos a la rarefaccin curvas, y puede, por tanto, (algo controvertido) se utiliza para
la extrapolacin de estas curvas para estimar la biodiversidad (Colwell y Coddington, 1994). Tambin es una ecuacin modelo importante
para la cintica qumica.

El algoritmo utiliza estimadores de mxima verosimilitud para la llamada transformacin Eadie-Hofstee (Raaijmakers 1987;
Colwell y Coddington 1994), seguido de optimizacin no lineal.

Logstico


ay cx
1 ser

A (en forma de S) curva sigmoidal. La ecuacin logstica puede modelar el crecimiento con saturacin (Brown & Rothery 1993), y fue
utilizado por Sepkoski (1984) para describir la estabilizacin propuesto de la diversidad marina a finales del Palaeozoic.

142
El valor de un se estima por primera vez por el valor mximo de Y, y segundo y do usando un ajuste de la recta a un modelo linealizado.
Finalmente optimizacin no lineal.

Gompertz

cx
ser
y AE

estimacin inicial se calcula utilizando un modelo de regresin en linealizado, seguido de optimizacin no lineal.

gaussiano



22

y AE
2 CBX

La 'curva de campana' con media segundo y la desviacin estndar do.

conjetura inicial de un por valor mximo de y, b por la media ponderada, y c = 1, seguido de optimizacin no lineal.

referencias

Brown, D. y P. Rothery. 1993. Modelos de la biologa: matemticas, estadstica e informtica. John Wiley & Sons.

Colwell, RK y JA Coddington. 1994. Estimacin de la biodiversidad terrestre mediante extrapolacin.


Philosophical Transactions de la Royal Society de Londres B 345: 101-118.

Raaijmakers, JGW 1987. El anlisis estadstico de la ecuacin de Michaelis-Menten. biometra 43: 793-
803.

Sepkoski, JJ 1984. Un modelo cintico de la diversidad taxonmica Fanerozoico. paleobiologa 10: 246-267.

143
regresin sinusoidal

Dos columnas deben ser seleccionados ( x y y valores). Una suma de hasta ocho sinusoides con perodos especificados por el usuario, pero con
amplitudes y fases desconocidas, se ajust a los datos. Esto puede ser til para periodicidades de modelado en serie temporal, tales como
ciclos de crecimiento anuales o ciclos climticos, generalmente en combinacin con el anlisis espectral. El algoritmo se basa en un criterio de
mnimos cuadrados y la descomposicin en valores singulares. Por defecto, los perodos se establecen en el rango de la x valores, y armnicos
(1/2, 1/3, 1/4, 1/5, 1/6, 1/7 y 1/8 del perodo fundamental). Estos valores se pueden cambiar, y no tienen que ser en proporcin armnica.

La opcin de perodos Fit optimizar secuencialmente el perodo de cada sinusoide (sobre el rango completo significativa de un
perodo a la frecuencia de Nyquist), despus de restar todos los sinusoides previamente instalados. Este es un simple ejemplo del
algoritmo de matching pursuit. El algoritmo es lento pero robusto y fiable ser bastante encontrar el ptimo global.

El valor de ji cuadrado es una medida de error apropiado - valores mayores significan peor ajuste. El Criterio de Informacin de Akaike tiene una
penalizacin por el nmero de sinusoides (la ecuacin utilizada supone que los perodos se estimaron a partir de los datos). El AIC debe ser lo ms
bajo posible para maximizar el ajuste, pero evitar el sobreajuste.

R 2 es el coeficiente de determinacin, o la proporcin de la varianza explicada por el modelo. Por ltimo, una pag
valor, en base a una F prueba, da el significado de la forma.

144
No tiene sentido para especificar periodicidades que son menores que dos veces la separacin tpica de puntos de datos.

Cada sinusoide est dada por y = A * cos (2 * pi * (xx 0) / T - p), dnde un es la amplitud, T es el perodo y pag es la fase. x 0 es la primera (la ms pequea) x
valor. Tambin se da una constante global de compensacin (media).

Tambin hay opciones para hacer cumplir un seno o coseno serie pura, es decir, con fases fijas.

145
spline suavizado

Dos columnas deben ser seleccionados ( x y Y valores). Los datos se ajustaron a una spline de suavizado, que es una secuencia de tercer
orden polinomios continua hasta la segunda derivada. Una aplicacin tpica es la construccin de una curva suave ir a travs de un
conjunto de datos ruidoso. El algoritmo sigue de Boor (2001). saltos bruscos en sus datos pueden dar lugar a oscilaciones en la curva, y
tambin se pueden obtener grandes excursiones en regiones con pocos puntos de datos. Mltiples puntos de datos en el mismo x valor se
contraen a un solo punto por promedio ponderado y el clculo de una desviacin estndar combinada.

Una tercera columna opcional especifica desviaciones estndar en los puntos de datos. Estos se utilizan para ponderar los datos. Si no se
especifica, que se ajustan a un 10% de la desviacin estndar de la Y valores.

El valor suavizado establecido por el usuario es una versin normalizada del factor de suavizado de de Boor (por defecto 1). Los valores ms altos
dan curvas ms suaves. Un valor de 0 se iniciar un segmento spline en cada punto. Al hacer clic en "Optimizar suavizar" va a calcular una "ptima"
suavizado por un procedimiento de validacin cruzada.

"Ver puntos dados" da una tabla de los puntos de datos dados X, Y y DESVEST ( Y), el correspondiente Y
los valores de la curva spline (ys) y los residuos. La prueba de ji cuadrado para cada punto puede ser utilizada para identificar valores atpicos. La

columna final sugiere una DESVEST ( Y) valor que se utilizar si forzando el valor p a 0,5.

Una columna de entrada cuarta opcional (si se usa entonces la tercera columna tambin debe ser llenado con valores STDEV) puede contener un
nmero diferente de valores de las columnas anteriores. Contiene x valores que se utilizan para la interpolacin entre los puntos de datos. columnas
opcionales 5-7 contienen lmites inferior y superior para x
valores (distribucin rectangular) y la desviacin estndar para Y valores (distribucin normal), para ser utilizados por bootstrapping simulacin
(Monte Carlo) proporcionar barras de error para los valores interpolados. Estas funciones se incluyen principalmente para el clculo de las edades
lmite para la escala de tiempo geolgico.

Referencia

de Boor, Carl. 2001. Una gua prctica para las estras. Saltador.

146
suavizado loess

Dos columnas deben ser seleccionados ( x y y valores). El algoritmo utilizado es LOWESS (Diagrama de dispersin LOcally tabuladas Smoothing;

Cleveland 1979, 1981), con sus parmetros por defecto recomendados (incluyendo dos iteraciones de robustez). Teniendo en cuenta una serie de

puntos norte y un parmetro de suavizado q especificado por el usuario, el programa se ajusta a la nq puntos alrededor de cada punto dado a una

lnea recta, con una funcin de ponderacin decreciente con la distancia. El nuevo punto de suavizado es el valor de la funcin lineal equipada en el

original x posicin.

los Oreja opcin estimar un intervalo de confianza del 95% para la curva basada en 999 repeticiones al azar. Con el fin de conservar la

estructura de la interpolacin, el procedimiento utiliza el remuestreo de los residuos en lugar de remuestreo de puntos de datos

originales.

Loess o spline suavizado?

Esto es casi una cuestin de gusto. Comparacin de las curvas ms arriba, para el mismo conjunto de datos. El spline a menudo da

una curva ms esttico debido a sus derivadas continuas, pero puede sufrir de rebasamiento cerca afiladas curvas en los datos.

referencias

Cleveland, WS 1979. robustos diagramas de dispersin de ajuste y suavizado ponderados localmente. Revista de la Asociacin Americana de

Estadstica 74: 829-836.

Cleveland, WS 1981. Un programa para el alisado de los diagramas de dispersin por robusta apropiado localmente ponderado. El Estadstico de

Amrica 35:54.

147
anlisis de mezclas

anlisis de mezcla es un mtodo de mxima probabilidad para estimar los parmetros (media, desviacin estndar y proporcin) de dos o
ms distribuciones normales univariados, basados en una muestra univariado agrupado. El programa tambin puede estimar la media y la
proporcin de distribucin exponencial y de Poisson. Por ejemplo, el mtodo puede ser utilizado para estudiar las diferencias entre sexos
(dos grupos), o varias especies, o clases de tamao, cuando no se dispone de informacin independiente sobre la pertenencia al grupo.

El programa espera una columna de datos univariados, que se supone ser tomado de una mezcla de poblaciones distribuidas normalmente
(o exponencial o de Poisson). En el siguiente ejemplo, tamaos de dos muestras de braquipodos se han agrupado en una muestra. Las
medias, desviaciones estndar y las proporciones de las dos muestras originales han sido casi perfectamente recuperado.

PASADO utiliza el algoritmo EM (Dempster et al. 1977), que pueden quedar atrapados en un ptimo local. Por consiguiente, el procedimiento se ejecuta de

forma automtica 20 veces, cada vez con nuevas posiciones, partida al azar para los medios. Los valores de partida para la desviacin estndar se

establecen para s / G, dnde s es la desviacin estndar combinada y GRAMO es el nmero de grupos. Los valores de partida para proporciones se

establecen en 1 / GRAMO. Todava se recomienda que el usuario ejecute el programa un par de veces para comprobar la estabilidad de la solucin

(soluciones "mejores" tienen valores de probabilidad log menos negativos).

El criterio de informacin de Akaike (AIC; Akaike 1974) se calcula con una correccin pequea muestra:

kk
1L(2k ln 2 2 AICc )

kn 1

dnde k es el nmero de parmetros, norte el nmero de puntos de datos y L la probabilidad de que el modelo da los datos. Un valor
mnimo para la AIC indica que se ha elegido el nmero de grupos que se produce el mejor ajuste y sin ajuste por exceso.

148
Es posible asignar cada uno de los puntos de datos para uno de los grupos con un enfoque de mxima verosimilitud. Esto se puede utilizar
como un mtodo de agrupamiento no jerrquico para datos univariados. El botn misiones se abrir una ventana donde se da el valor de
cada funcin de densidad de probabilidad para cada punto de datos. El punto de datos se puede asignar al grupo que muestra el valor ms
grande.

Los datos que faltan: Con el apoyo de la eliminacin.

referencias

Akaike, H. 1974. Una nueva mirada a la identificacin del modelo estadstico. IEEE Transactions on Control Automtico 19: 716-723.

Dempster, AP, Laird, Nuevo Mxico y Rubin, DB 1977. Mxima verosimilitud de los datos incompletos mediante el algoritmo EM". Revista
de la Sociedad Real de Estadstica, Serie B 39: 1-38.

149
modelos de abundancia

Este mdulo puede ser usado para el trazado abundancias taxn en orden descendente rango en una escala lineal o logartmica (parcela Whittaker), o el

nmero de especies en las clases de abundancia de octava (como se muestra en el montaje de log-normal de distribucin). Taxones van en filas. Tambin

puede ajustar los datos a uno de los cuatro modelos de abundancia estndar diferentes:

Geomtrica, donde la 2 especie ms abundante deben tener un recuento del taxn k < 1 vez el ms abundante, el tercero ms

abundante un recuento de taxn k veces el segundo ms abundante etc. para una constante k. Con norte yo el recuento del yo th
yo 1
taxn ms abundante, tenemos yo
1
knn .

Esto le dar una lnea recta descendente en la trama Whittaker. El montaje es por simple regresin lineal de las
abundancias de registro.

Log-serie, con dos parmetros alfa y x. El algoritmo de ajuste es de Krebs (1989). El nmero de especies con norte individuos
(esta ecuacin no se traduce directamente a la representacin grfica Whittaker):


norte


norte S
nx

palo roto (MacArthur 1957). No hay parmetros libres para ser instalados en este modelo. Con
S nene el nmero total de especies y norte nene el nmero total de individuos:

es
1
nene


tot i

SS nn j
.
tot j 0 nene

Log-normal. El algoritmo de ajuste es de Krebs (1989). El logaritmo (base 10) de la media y la varianza equipada se dan.
los octavas consulte de potencias de 2 clases de abundancia:

Octave Abundancia 1

2 2a3

marzo 4-7 4

8-15 5

16-31 6

32-63 7

64-127

... ...

Se da un valor de significacin basada en chi-cuadrado para cada uno de estos modelos, pero la potencia de la prueba no es la misma para los
cuatro modelos y los valores de significacin por lo tanto no debe ser comparado. Eso
150
Es importante, como siempre, hay que recordar que un alto pag valor no puede interpretarse en el sentido de un buen ajuste. Un valor bajo embargo, no

significa un mal ajuste. Tambin tenga en cuenta que no parecen las pruebas de chi-cuadrado en el pasado para corresponder con algn otro software,

posiblemente porque los recuentos de uso en el pasado en lugar de los valores logtransformed en las parcelas de Whittaker.

referencias

Krebs, CJ 1989. Metodologa ecolgica. Harper & Row, Nueva York.

MacArthur, RH 1957. En la abundancia relativa de las especies de aves. Actas de la Academia Nacional de Ciencias,
EE.UU. 43: 293-295.

151
Especies de embalaje (gaussiana)

Este mdulo se ajusta a los modelos de respuesta de Gauss a la abundancia de especies a lo largo de un gradiente, por una o ms especies. Los
parmetros ajustados son ptima (promedio), la tolerancia (desviacin estndar) y el mximo.

El mdulo requiere una primera columna de mediciones ambientales en las muestras (por ejemplo, temperatura), y una o
ms columnas adicionales de datos de abundancia (taxones en columnas).

El algoritmo es el mismo que para la funcin de Gauss en el mdulo de regresin no lineal: estimacin inicial del ptimo y
tolerancia basada en el promedio ponderado, seguida de una optimizacin no lineal por el mtodo de
Levenberg-Marquardt.

152
espiral logartmica

Se adapta un conjunto de puntos en el plano a una espiral logartmica. til para la caracterizacin por ejemplo moluscos conchas, dientes, garras y

cuernos. Requiere dos columnas de coordenadas (x e y). Los puntos deben recibir en la secuencia, ya sea hacia el interior o hacia el exterior.

espirales zurdos como para diestros son ambos aceptables.


segundo
La espiral equipada en coordenadas polares: r ae . La escala un y el exponente segundo se dan, junto
con el punto central estimada, marcada con una cruz roja. La tasa de expansin verticilo W ( aumento del factor de radio por verticilo) se
2
e
segundo
calcula a partir segundo como W .

La posicin central se estima mediante la optimizacin no lineal y la espiral en s por linealizacin y la regresin.

153
men de la diversidad

Los ndices de diversidad

Estas estadsticas se aplican a datos de asociacin, donde el nmero de individuos estn tabulados en filas (taxones) y posiblemente varias

columnas (muestras). Las estadsticas disponibles son los siguientes, para cada muestra:

Nmero de taxones ( S)

Nmero total de individuos ( norte)

Dominancia index = 1-Simpson. Vara de 0 (todos los taxones estn igualmente presentes) a 1 (uno taxn domina la
comunidad completamente).
2
yo
D nn dnde norte yo es el nmero de individuos de taxn yo.
yo

ndice de Simpson 1- RE. Medidas 'uniformidad' de la comunidad de 0 a 1. Tomar nota de la confusin en la literatura: La dominacin
y los ndices de Simpson a menudo se intercambian!

ndice de Shannon (entropa). Un ndice de diversidad, teniendo en cuenta el nmero de las personas, as como el nmero de taxones.
Vara desde 0 para las comunidades con un solo taxn a valores altos para las comunidades con muchos taxones, cada uno con
pocos individuos.


ii
En
H nnnn
yo

Buzas y uniformidad de Gibson: mi MARIDO/ S

154
El ndice de Brillouin:

HB

En! En nnyo!

yo

norte

S
ndice de riqueza de Menhinick:
n

ndice de riqueza de Margalef: ( S-1) / ln ( norte)

Equidad. diversidad de Shannon dividido por el logaritmo del nmero de taxones. Esto mide la uniformidad con que los
individuos se dividen entre los taxones presentes.

alfa de Fisher - un ndice de diversidad, definida implcitamente por la frmula S = a * ln ( 1 + n / a) dnde S es el nmero de taxones, norte
es el nmero de individuos y un es alfa de Fisher.

Berger-Parker dominancia: simplemente el nmero de individuos en el taxn dominante en relacin con


norte.

Chao1, el sesgo corregido: Una estimacin de la riqueza total de especies. Chao1 = S + F 1 ( F 1 - 1) / (2 ( F 2 +


1)), donde F 1 es el nmero de especies Singleton y F 2 el nmero de especies doubleton.

Muchos de estos ndices se explican en Harper (1999).

los intervalos de confianza aproximados para todos estos ndices se pueden calcular con un procedimiento de arranque. El nmero dado de
muestras aleatorias (por defecto 9999) se producen, cada una con el mismo nmero total de individuos como en la muestra original. Para cada
individuo en la muestra aleatoria, el taxn se elige con probabilidades proporcionales a las abundancias originales. a continuacin, se calcula un
intervalo de confianza del 95 por ciento. Tenga en cuenta que la diversidad en las repeticiones ser a menudo menor que, y nunca ms grande
que, la diversidad se agrupan en el conjunto de datos total - este sesgo puede opcionalmente ser fijo centrando el intervalo de confianza en el
valor original.

Bootstrapped comparacin de los ndices de diversidad en dos muestras se proporciona en el mdulo de comparacin diversidades.

Referencia

Harper, DAT (ed.). 1999. numrica Paleobiologa. John Wiley & Sons.

155
riqueza Quadrat
Requiere dos o ms columnas, cada una de presencia / ausencia contiene (1/0) de diferentes taxones abajo las filas (abundancia
positivo se trata como presencia).

Cuatro especies no paramtricas estimadores de riqueza se incluyen en el pasado: Chao 2, navaja de bolsillo de primer y segundo orden, y de
arranque. Todo esto requiere datos de presencia-ausencia en dos o ms cuadrantes muestreados de igual tamao. Colwell y Coddington
(1994) revisaron estos estimadores, y encontraron que el Chao2 y la navaja de bolsillo de segundo orden realizan mejor.

La salida del pasado se divide en dos paneles. En primer lugar, los estimadores de riqueza y sus desviaciones estndar de anlisis (slo
para Chao2 y Jackknife1) se calculan a partir del conjunto dado de muestras. A continuacin, los estimadores se calculan a partir de
1000 resamplings aleatorias de las muestras con reemplazo (bootstrapping), y se informan sus medios y desviaciones estndar. En otras
palabras, las desviaciones estndar reportados son estimaciones de arranque, y no se basan en las ecuaciones analticas.

Chao2

El estimador Chao2 (Chao 1987) se calcula como en las estimaciones de la versin 8.2.0 (Colwell 2009), con la correccin de sesgo:

1 1

Chao 2 obs
22 1
1
mm SS QQQ 1

dnde S obs es el nmero total observada de las especies, metro el nmero de muestras, Q 1 el nmero de visitantes nicos (especies que se producen

en, precisamente, una muestra) y Q 2 el nmero de duplicados (especies que se producen en exactamente dos muestras).

Si Q 1> 0 y Q 2> 0, varianza se calcula como

112 2 12212 2

1 1 1 1 mm
QQQ 1
a v r 2 1 1 2 .
2
2 1 mm
QQQ
1 2 4
mm S Chao
QQQ
42 1 Q 42 1

156
Si Q 1> 0, pero Q 2 = 0:

112 2

1 1 1 21 1
a v r
1
1 .
Chao
4412
2

2 mm QQ mm QQ4 mm S SQ
Chao 2

Si Q 1 = 0:

a v r
Chao 2
SSSM
obs
obs
1 EE
SM
obs
,

dnde METRO es el nmero total de ocurrencias de todas las especies en todas las muestras.

jackknife 1

De primer orden navaja de bolsillo (Burnham y Overton 1978, 1979; Heltshe y Forrester 1983):

1
Jack 1
obs
mm SS Q 1 .

1
S 2

a v r ,
2

1
Jack 1
Q fjmm S j
m
j 0

dnde F j es el nmero de muestras que contienen j especies nicas.

jackknife 2

De segundo orden navaja de bolsillo (Smith y van Belle 1984):

2
2 3 2

1

2
.
Jack 2 obs
Q mm QSS mmm
1

No existe una estimacin analtica de la varianza est disponible.

Oreja

Bootstrap estimador (Smith y van Belle 1984):

S obs
mk

obs
SSarranque 1 pag ,
k1

dnde pag k es la proporcin de muestras que contienen especies k. No existe una estimacin analtica de la varianza est disponible.

referencias

157
Burnham, KP y WS Overton. 1978. Estimacin del tamao de una poblacin cerrada cuando probabilidades de captura varan entre
los animales. Biomtrika 65: 623-633.

Burnham, KP y WS Overton. 1979. estimacin robusta del tamao de la poblacin, cuando las probabilidades de captura varan
entre los animales. Ecologa 60: 927-936.

Chao, A. 1987. La estimacin del tamao de la poblacin para los datos de captura-recaptura con capturabilidad desigual.

biometra 43, 783-791.

Colwell, RK y JA Coddington. 1994. Estimacin de la biodiversidad terrestre mediante extrapolacin. Philosophical


Transactions de la Royal Society (Serie B) 345: 101-118.

Heltshe, J. & NE Forrester. 1983. Estimacin de la riqueza de especies utilizando el procedimiento de navaja.
biometra 39: 1-11.

Smith, EP y G. van Belle. 1984. Estimacin no paramtrica de la riqueza de especies. biometra 40: 119-
129.

158
La diversidad beta

Dos o ms columnas (muestras) de presencia-ausencia (0/1) de datos, con taxones en filas.

El mdulo de la diversidad beta en el pasado se puede utilizar para cualquier nmero de muestras (no limitada a slo dos muestras). Los
ocho medidas disponibles se describen en Koleff et al. (2003):

Pasado Koleff et al. Ecuacin rbitro.

S Whittaker
Whittaker segundo w 1
(1960)

Harrison et
1
al. (1992)
Harrison segundo- 1
NS 1

Hg H l Cody
Cody segundo do
(1975)
2

Routledge
Routledge segundo yo 10
log
yo
log 110
TT ee

yo yo
1 log10
yo (1977)
yo T yo

Hg H l Wilson &
Wilson-Shmida b t Shmida
2
(1984)

Hg H l Mourelle y
Mourelle segundo yo Ezcurra
2norte 1
(1997)

Harrison et
al. (1992)
Harrison 2 segundo- 2 mx

NS 1 1

Williams
mx
Williams segundo- 3 1 (1996)
S

159
S: nmero total de especies; : nmero promedio de especies; NORTE: nmero de muestras; g (H): ganancia total de las especies a lo largo del gradiente
(muestras clasificadas a lo largo de columnas); l (H): prdida total de las especies; mi yo: nmero de muestras que contienen especies yo; T: nmero total de

ocurrencias.

referencias

Harrison, S., SJ Ross & JH Lawton. 1992. Beta diversidad de gradientes geogrficos en Gran Bretaa. Journal of Animal Ecology 61:
151-158.

Koleff, P., KJ Gaston y JJ Lennon. la diversidad beta de 2003. La medicin de los datos de presencia-ausencia.
Journal of Animal Ecology 72: 367-382.

Routledge, RD 1977. Por componentes de la diversidad de Whittaker. Ecologa 58: 1120-1127.

Whittaker, RH 1960. La vegetacin de las montaas de Siskiyou, Oregon y California. Monografas ecolgica 30:
279-338.

160
distincin taxonmica

Requiere una o ms columnas (muestras), cada uno conteniendo recuentos de individuos de diferentes taxones por las filas.
Adems, una o ms columnas de grupo con nombres de gneros / familias etc. (vase ms adelante).

diversidad taxonmica y distincin taxonmica como se define por Clarke y Warwick (1998), incluyendo los intervalos de confianza

calculados a partir de 1000 repeticiones aleatorias tomadas del conjunto de datos combinado (todas las muestras). Tenga en cuenta que la

lista de "global" de Clarke y Warwick no se introduce directamente, sino que se calcula internamente por la puesta en comn (sumando) las

muestras dadas.

Estos ndices dependen de la informacin taxonmica tambin por encima del nivel de la especie, que se tiene que introducir para cada

especie de la siguiente manera. nombres de las especies van en la columna de nombre (ms a la izquierda, en los atributos de la fila),

nombres de gnero en la primera columna de grupo, familia en la columna de grupo segundo, etc., hasta seis columnas de grupo. Por

supuesto, se puede sustituir por otros niveles taxonmicos, siempre y cuando estn en orden ascendente. Los recuentos de especies para las

muestras siguen en las columnas a partir de entonces.

distincin taxonmica en una muestra est dada por (existen fichas otras formas, equivalentes):

ij
XXW
ji
Ji
,
Ji
xxxx
ii
1 2
Ji yo

161
donde el w ij son pesos de tal manera que w ij = 0 si yo y j son la misma especie, w ij = 1 si son del mismo gnero, etc. El x son
las abundancias.

distincin taxonmica:

ij
XXW
ji
*
.
xxjiji
Ji

Para los datos de presencia-ausencia, la diversidad taxonmica y distincin sern vlidas pero iguales entre s.

Referencia

Clarke, KR y Warwick, RM 1998. Un ndice de distincin taxonmica y sus propiedades estadsticas.


Journal of Applied Ecology 35: 523-531.

162
rarefaccin individual

Para comparar la diversidad taxonmica en muestras de diferentes tamaos. Requiere una o ms columnas de cargos de individuos de
diferentes taxones (cada columna debe tener el mismo nmero de valores). Al comparar las muestras: Las muestras deben ser
taxonmicamente similares, obtenidas mediante muestreo estandarizado y tomado de 'hbitat' similar.

Teniendo en cuenta una o ms columnas de datos de abundancia para un nmero de taxones, este mdulo calcula cuntos taxones que se esperara
encontrar en una muestra con un menor nmero total de individuos. Con este mtodo, se puede comparar el nmero de taxones en muestras de
diferente tamao. Utilizando el anlisis de rarefaccin en una muestra grande, se puede leer el nmero de taxones esperado para cualquier tamao
de muestra ms pequeo (entre ellos el de la pequesimo muestra). El algoritmo es de Krebs (1989), usando una funcin Gamma de registro para el
clculo de trminos combinatorios. Un ejemplo de aplicacin en la paleontologa se puede encontrar en Adrain et al. (2000).

Dejar norte ser el nmero total de individuos en la muestra, s el nmero total de especies, y norte yo el nmero de individuos de las especies Nmero
yo. El nmero esperado de especies E (S norte) en una muestra de tamao norte
y la varianza V (S norte) a continuacin, se dan por

yo


s
1
SEnorte
yo 1 NN



n NN

163


yo yo

s




SVnorte 1

yo

1
NN
NN


n N N n N N

NNN
Ji yo
j

s j1





NNN


n n NN
2



j 2 yo 1 N
nn n

n n

Los errores estndar (races cuadradas de las varianzas de remuestreo) se dan por el programa. En la representacin grfica, estos errores

estndar se convierten a intervalos de confianza del 95 por ciento.

varianza incondicional

La rarefaccin varianza clsica dada arriba se llama varianza condicional. Es condicionada a la muestra de referencia, y reducir a
cero para S n = s. En contraste, Colwell et al. (2012) describieron una estimacin de la varianza rarefaccin incondicional que no reducir
a cero al final de la curva de rarefaccin. Este mtodo tambin est disponible en el pasado.

Hay dos modelos para rarefaccin individuales descritos por Colwell et al. (2012), el modelo multinomial (rarefaccin clsica) y el modelo
de Poisson (rarefaccin Coleman). Los dos mtodos dan resultados bastante similares. El software de rarefaccin estndar de la
industria, estima, algo calcula incongruentemente E (S norte) de acuerdo con la ecuacin multinomial (eq. (4) en Colwell et al., equivalente a
la ecuacin dada ms arriba), mientras V (S norte) utiliza la formulacin de Poisson (eq. 7 en Colwell et al.), de acuerdo con el manual de
estimaciones. Este enfoque es seguido en el pasado para la compatibilidad con las estimaciones. El clculo tambin requiere una
estimacin para el total de (muestreada y sin muestrear) riqueza de especies. El estimador Chao1 se utiliza para este (cf. Colwell et al.
2012).

referencias

Adrian, JM, SR Westrop & DE Chatterton. 2000. Silrico diversidad alfa trilobites y la extincin masiva
endOrdovician. paleobiologa 26: 625-646.

Colwell, RK, Chao, A., Gotelli, NJ, Lin, S.-L., Mao, CX, Chazdon, RL y Longino, JT 2012. Modelos y estimadores enlazan de base
individual y basado en muestras de rarefaccin, la extrapolacin y la comparacin de los conjuntos. Journal of Ecology Plant 5: 3-21.

Krebs, CJ 1989. Metodologa ecolgica. Harper & Row, Nueva York.

164
rarefaccin de la muestra (tau de Mao)
rarefaccin de muestra requiere una matriz de datos de presencia-ausencia (abundancias tratados como presencias), con taxones en filas y
muestras en columnas. Sample-basado rarefaccin (tambin conocida como la curva de acumulacin de especies) es aplicable cuando se dispone
de un nmero de muestras, de la cual la riqueza de especies es para ser estimada como una funcin del nmero de muestras. PASADO implementa
la solucin analtica conocida como "tau de Mao", con desviacin estndar. En la representacin grfica, los errores estndar se convierten a
intervalos de confianza del 95 por ciento. Ver Colwell et al. (2004) para ms detalles.

Con MARIDO y muestras S obs el nmero total de especies observadas, y mucho s j ser el nmero de especies encontradas en j muestras, de tal manera que s 1

es el nmero de especies encontradas en exactamente una muestra, etc. El nmero total de especies que se esperan de marido MARIDO muestras es

entonces

MARIDO

~ S h
obs s
jh j
.
j1

Los coeficientes combinatorios son

Hh H ! j !
para !
!hj H jh H
H
Jh
.
de 0 hj H

Estos coeficientes se calculan a travs de una funcin gamma registro. El estimador de la varianza es

~2

MARIDO

1
~ 2

2

jh j ~ ,
j1 S hs

dnde S ~ es un estimador de la riqueza total de especies desconocidas. Siguiendo Colwell et al. (2004), se utiliza un estimador de tipo
Chao2. por s 2> 0,

1 s 1
2
~ HSS
obs
.
2 Hs 2

por s 2 = 0,

~ HSS 11ss1 1
obs
.
H 2
s2 1

Para el modelado y la extrapolacin de la curva usando la ecuacin de Michaelis-Menten, utilice el botn Copiar datos, pegue a una nueva
hoja de clculo Pasado, y utilizar el mdulo de ajuste no lineal en el men Modelo.

Referencia

Colwell, RK, CX Mao & J. Chang. 2004. interpolacin, extrapolacin, y la comparacin de las curvas de acumulacin de especies basados en la
incidencia. Ecologa 85: 2717-2727.

165
El anlisis ELLA

SHE anlisis (Hayek y Buzas 1997, Buzas y Hayek 1998) requiere una matriz de enteros de abundancia de datos (recuentos), con taxones en
filas y muestras en columnas. El programa calcula la abundancia de especies de registro (ln S), ndice de Shannon ( MARIDO) log uniformidad (ln E
= H - ln S) para la primera muestra. A continuacin se aade la segunda muestra a la primera, y el proceso contina. Los perfiles SHE
acumuladas resultantes pueden ser interpretados ecolgicamente. Si las muestras se toman no de una poblacin homognea, pero a travs de
un gradiente o una seccin estratigrfica, roturas en la curva se pueden usar para inferir discontinuidades (por ejemplo, de biozono lmites).

referencias

Buzas, MA & L.-AC Hayek. 1998. anlisis ELLA para la identificacin biofacies. La Revista de Investigacin Foraminiferal 28:
233-239.

Hayek, L.-AC & MA Buzas. 1997. Examinando las poblaciones naturales. Columbia University Press.

166
prueba de permutacin Diversidad

Espera dos columnas de datos de abundancia con taxones hacia abajo el mdulo rows.This calcula un nmero de ndices de diversidad para
dos muestras y, a continuacin, compara las diversidades utilizando permutaciones aleatorias. 9999 matrices aleatorias con dos columnas
(muestras) se generan, cada uno con la misma fila y columna totales como en la matriz de datos original.

167
Diversidad t prueba

La comparacin de las diversidades de Shannon y Simpson en dos muestras. entonces Shannon t ensayo se describe por ejemplo Hutcheson
(1970), Poole (1974), Magurran (1988). Esta es una alternativa a la prueba de azar disponible en el prueba de permutacin Diversidad mdulo.
Requiere dos columnas de datos de la abundancia con los taxones entre las filas.

los ndice de Shannon aqu incluir una correccin de sesgo y puede divergir ligeramente de las estimaciones no corregidas calculadas en
el pasado en otro lugar, al menos para muestras pequeas. Con pag yo la proporcin (0-1) de taxn es el nmero de taxones y norte el
nmero de individuos, el estimador del ndice es


S
1
ln '
pp H
ii

2 NS
(Tenga en cuenta que el segundo trmino es incorrecto en Magurran 1988).
yo 1

La varianza del estimador es


2
lnH En pppp 1
'Var ii ii
2
.
norte 2 NS

los t estadstica de prueba est dada por

t
1 HH2
.
var
var S.S2
1

Los grados de libertad para el t prueba es

2

var S.S
var
1

2
df .
2 2
var
HAMPSHIRE
var HAMPSHIRE

1 2

NUEVA
1
NUEVA
2

los ndice de Simpson ( dominancia) ha estimado varianza (Brower et al 1998).:


2

3 2
2 12 NN
2
yo
2p1NNN 2 1 4p Var
NNND yo
3 p yo
2
.
2
NN 1

referencias

Brower, JE, Zar, JH, von Ende, CN 1998. Mtodos de campo y de laboratorio de Ecologa General.
McGraw-Hill, Boston.
Hutcheson, K. 1970. Una prueba para la comparacin de diversidades en base a la frmula de Shannon. Journal of Theoretical Biology 29:
151-154.
Magurran, A. 1988. Diversidad ecolgica y su medicin. Princeton University Press. Poole, RW 1974. Una
introduccin a la ecologa cuantitativa. McGraw-Hill, Nueva York.

168
perfiles de diversidad
Este mdulo requiere una o ms columnas de datos de la abundancia con los taxones entre las filas. El objetivo principal es comparar las
diversidades en varias muestras.

La validez de la comparacin de la diversidad a travs de muestras puede ser criticado debido a la eleccin arbitraria del ndice de diversidad. Una

muestra puede contener, por ejemplo un mayor nmero de taxones, mientras que el otro tiene un ndice de Shannon ms grande. Una serie de ndices

de diversidad se puede comparar para asegurarse de que el ordenamiento diversidad es robusto. Una manera formal de hacer esto es definir una familia

de ndices de diversidad, que dependen de un nico parmetro continua (Tothmeresz 1995).

PASADO utiliza el exponencial de la llamada ndice Renyi, que depende de un parmetro . por = 0, esta funcin da el nmero
total de especies. = 1 (en el lmite) da un ndice proporcional al ndice de Shannon, mientras = 2 da un ndice que se comporta
como el ndice de Simpson.



MARIDO

exp
1 exp ln 1 pag
yo

yo 1

El programa puede trazar varios de estos perfiles de diversidad juntos. Si los perfiles de cruz, las diversidades no son comparables. La
opcin de arranque (dando un intervalo de confianza del 95%) se basa en 2000 rplicas.

Referencia

Tothmeresz, B. 1995. Comparacin de diferentes mtodos para la ordenacin de la diversidad. Revista de Ciencias de la vegetacin 6:

283-290.

169
men de series temporales

periodograma sencilla

Puesto que los datos paleontolgicos a menudo se muestrean de forma desigual, mtodos basados en Fourier pueden ser difciles de usar. por lo tanto

PASADO incluye el algoritmo Lomb periodograma para los datos de forma desigual en la muestra (Press et al. 1992), con valores de tiempo dados en la

primera columna y los valores dependientes en la segunda columna. Si slo se selecciona una columna, se asume una separacin incluso de una unidad

entre puntos de datos. El periodograma de Lomb debe entonces dar resultados similares a los de la FFT. Los datos se Detrended automticamente antes

del anlisis.

El eje de frecuencia est en unidades de 1 / (unidad x). Si por ejemplo, su x los valores se dan en millones de aos, una frecuencia de 0,1 corresponde a

un perodo de 10 millones de aos. El eje de potencia est en unidades proporcionales al cuadrado de las amplitudes de las sinusoides presentes en los

datos. Tambin tenga en cuenta que el eje de frecuencia se extiende a valores muy altos. Si los datos se muestrean de manera uniforme, la mitad

superior del espectro es una imagen especular de la mitad inferior, y es de poca utilidad. Si algunos de sus regiones estn estrechamente muestra, el

algoritmo puede ser capaz de encontrar informacin til incluso por encima del medio punto (frecuencia de Nyquist).

El pico ms alto en el espectro se presenta con su frecuencia y valor de potencia, junto con una probabilidad de que el pico podra ocurrir a
partir de datos aleatorios. Los 0,01 y 0,05 niveles de significacin ( 'lneas de ruido blanco') se muestran como lneas discontinuas rojo.

El ejemplo anterior muestra un anlisis espectral de un registro de istopos foram oxgeno de 1 Ma a reciente, con una separacin incluso
de 0.003 Ma (3 ka). Hay periodicidades a frecuencias de alrededor de 9 (pico dividido), 25 y 43 Ma- 1, correspondiente a los perodos de 111
ka, 40 ka y 23 ka - claramente orbital forzar.

Referencia

Prensa, WH, SA Teukolsky, WT Vetterling y BP Flannery. 1992. Numerical Recipes en C. Cambridge University Press.

170
anlisis espectral REDFIT

Este mdulo es una aplicacin del procedimiento de Schulz y REDFIT Mudelsee (2002). Es una versin ms avanzada de la sencilla
periodograma de Lomb ha descrito anteriormente. REDFIT incluye una opcin para Welch solapado promedio segmento, lo que implica la
divisin de la serie de tiempo en un nmero de segmentos, la superposicin en un 50%, y un promedio de sus espectros. Esto reduce el ruido
sino que tambin reduce la resolucin espectral. Adems, la serie de tiempo est acoplada a un (1) modelo de ruido rojo AR que normalmente
es una hiptesis nula ms apropiado que el modelo de ruido blanco se describi anteriormente. Las lneas falsealarm dadas se basan en
ambas aproximaciones paramtricas (Chi2) y Monte Carlo (usando 1000 realizaciones aleatorias de un (1) Proceso de AR).

La entrada debe estar en la forma de dos columnas con valores de datos de tiempo y, o una columna de valores de datos equallyspaced. Los
datos se Detrended automticamente. El accesorio para AR (1) implica que los datos deben tener la direccin de tiempo correcto (en contraste
con la simple espectrograma por encima de donde la direccin de tiempo es arbitraria). Se espera que los valores de tiempo para estar edades
antes del presente. Si no es as, ser necesario darles signos negativos.

El valor de sobremuestreo de frecuencia controla el nmero de puntos a lo largo del eje de frecuencia (pero tener muchos puntos no
aumenta la resolucin de frecuencia!). El aumento del nmero de segmentos reducir el ruido, sino tambin disminuir su resolucin. La
funcin de ventana influye en el equilibrio entre la resolucin espectral y la atenuacin de los lbulos laterales.

El (promedio) valor tau es la escala de tiempo caracterstica (el parmetro del modelo AR). El ancho de banda es la
resolucin espectral dada como la anchura entre los puntos de -6dB.

El ajuste a un modelo AR (1) se puede evaluar utilizando el valor de carreras y su intervalo de aceptacin 5%. Esta prueba slo est disponible
con Monte Carlo en, sobremuestreo = 1, los segmentos = 1, ventana = rectangular.

171
Adems de un conjunto fijo de niveles de falsa alarma (80%, 90%, 95% y 99%), el programa tambin informa de un nivel de falsas alarmas
crtico (Falso-al) que depende de la longitud del segmento (Thomson 1990).

Importante: Debido a tiempo de clculo largo, la simulacin de Monte Carlo no se ejecuta de forma predeterminada, y por lo tanto los niveles de
falsas alarmas de Monte Carlo no estn disponibles. Cuando la opcin de Monte Carlo est activada, el espectro dado puede cambiar un poco
debido a que los resultados de Monte Carlo se utilizan luego para calcular una versin de sesgo corregido (vase Schulz y Mudelsee 2002).

referencias

Schulz, M. & M. Mudelsee. 2002. REDFIT: la estimacin de los espectros de ruido rojo directamente de series de tiempo paleoclimtica desigualmente

espaciadas. Computers & Geosciences 28: 421-426.

Thomson, DJ 1990. Tiempo de anlisis de series de datos climticos del Holoceno. Philosophical Transactions de la Royal Society de
Londres, serie A 330: 601-616.

172
anlisis espectral Multitaper

En estimacin espectral tradicional, los datos son a menudo de ventana (multiplicado con una funcin en forma de campana) con
el fin de reducir la fuga espectral. En el mtodo multitaper, se aplican varios (ortogonales) funciones de ventana diferentes, y los
resultados combinados. El espectro resultante tiene una baja fuga, baja varianza, y conserva la informacin contenida en el principio
y final de la serie de tiempo. Adems, la prueba estadstica puede aprovechar las mltiples estimaciones espectrales. Una posible
desventaja se reduce la resolucin espectral.

El mtodo multitaper requiere espaciadas uniformemente datos, dados en una columna.

La puesta en prctica en el pasado se basa en el cdigo de Lees y Park (1995). El espectro multitaper puede ser comparado con un
periodograma sencilla (FFT con una ventana de coseno 10%) y un periodograma alisada. El nmero de conos (Nwin) se puede ajustar a 3, 4 o
5, para diferentes soluciones de compromiso entre la reduccin de la varianza y la resolucin. El producto ancho de banda-tiempo pag se fija en
3,0.

los F prueba para la significacin de la periodicidad sigue Lees & Park (1995). Los 0,05 y 0,01 niveles de significacin se muestran como
lneas horizontales, basado en 2 y 2 * Nwin-2 grados de libertad.

Los datos son cero acolchado a la fuente de segundo ms bajo de 2 por encima de la longitud de la secuencia. Esto es necesario para reproducir los

resultados de las pruebas dadas por Lees y Park (1995).

Referencia

Lees, JM y J. Park. 1995. Multiple-Reduccin anlisis espectral: un stand-alone C-subrutina. Computers & Geosciences 21: 199-236.

173
transformada Walsh

La transformada Walsh es un tipo de anlisis espectral (para encontrar periodicidades) de datos binarios o ordinales. Supone un espaciamiento
uniforme de puntos de datos, y espera una columna de datos binarios (0/1) u ordinales (entero).

Los mtodos normales de anlisis espectral son quizs no ptimo para datos binarios, ya que descomponen la serie temporal en sinusoides
en lugar de "ondas cuadradas". La transformada Walsh luego puede ser una mejor opcin, usando funciones de base que alternar entre -1 y
+1. Estas funciones de base tienen diferentes "frecuencias" (nmero de transiciones dividido por dos), conocido como Seqncies. En el
pasado, cada par de incluso ( "cal") e impares ( "sal") funciones de base se combina en un valor de potencia utilizando cal 2+ sal 2,

la produccin de un "espectro de potencia" que es comparable con el periodograma de Lomb.

En el ejemplo anterior, comparar el periodograma Walsh (superior) para el periodograma de Lomb (abajo). El conjunto de datos tiene 0.125
perodos por muestra. Ambos anlisis muestran armnicos.

La transformada de Walsh es ligeramente extico en comparacin con la transformada de Fourier, y los resultados deben ser
interpretado con cautela. Por ejemplo, los efectos del ciclo de trabajo (porcentaje de los frente a ceros) son algo difciles de entender.

En el pasado, los valores de datos son pre-procesados multiplicando con dos y restando uno, con lo que 0/1 valores binarios en el rango
ptimo -1 / + 1 para la transformada Walsh. Los datos son cero acolchado a la siguiente potencia de 2 si es necesario, como es requerido por
el mtodo.

174
De corta duracin transformada de Fourier

El anlisis espectral usando la transformada de Fourier (FFT), pero dividir la seal en una secuencia de ventanas superpuestas, que se
analizan individualmente. Esto permite el desarrollo del espectro en el tiempo, en contraste con el anlisis global proporcionada por los
otros mdulos de anlisis espectral. posicin de la muestra se muestra en la x eje, la frecuencia (en perodos por muestra) en el y eje, y el
poder en una escala logartmica como el color o escala de grises.

La corta duracin de Transformada de Fourier (STFT) puede ser comparado con el anlisis wavelet, pero con una escala de frecuencia lineal y con

constante de tiempo de resolucin independiente de la frecuencia.

El tamao de la ventana controla el equilibrio entre la resolucin en tiempo y frecuencia; pequeas ventanas dan buena resolucin temporal, pero
pobre resolucin de frecuencia. Windows son cero acolchado por un factor de ocho a dar una apariencia ms suave del diagrama a lo largo del
eje de frecuencia. Las funciones de ventana (rectngulo, Welch, Hanning, Hamming, Blackman-Harris, multitaper con 3, 4 o 5 se estrecha) dan
diferentes soluciones de compromiso entre resolucin de frecuencia y el rechazo de banda lateral.

175
transformada wavelet

La inspeccin de las series de tiempo a diferentes escalas. Requiere una columna de datos ordinales o continuos con un espaciamiento uniforme de

puntos.

La transformada wavelet continua (CWT) es un mtodo de anlisis, donde un conjunto de datos puede ser inspeccionado a escalas pequeas,
medianas y grandes al mismo tiempo. Puede ser til para detectar periodicidades en diferentes longitudes de onda, la auto-similitud y otras
caractersticas. El eje vertical en la trama es una escala logartmica tamao (base 2), con la seal observada en una escala de slo dos puntos de
datos consecutivos en la parte superior, y en una escala de un cuarto de toda la secuencia en la parte inferior. Una unidad en este eje corresponde a
una duplicacin de la escala de tamao. La parte superior de la figura representa, pues, una visin detallada de grano fino, mientras que la parte
inferior representa una visin general de las tendencias a largo alisado. potencia de la seal (o la fuerza de correlacin ms cuadrado correctamente
con la wavelet madre reducido) se muestra con una escala de grises o en color.

La forma de la wavelet madre se puede configurar para Morlet (nmero de onda 6), Paul (4 orden) o un perro (derivado de la gaussiana, 2 Dakota

del Norte o 6 derivado). El tren de ondas de Morlet generalmente funciona mejor.

El ejemplo anterior se basa en un registro de istopos foram oxgeno de 1 Ma a reciente, con una separacin incluso de 0.003 Ma (3 ka). Una banda

puede ser vista en una escala de aproximadamente 2 5 = 32 muestras, o alrededor de 100 ka. Una banda ms dbil alrededor de 2 3.7 = 13 muestras

corresponde a una escala de alrededor de 40 ka. Estas son las periodicidades orbitales. En contraste con el anlisis espectral a granel, el

escalograma hace cambios visibles en la fuerza y la frecuencia con el tiempo.

El denominado cono de influencia se puede trazar para mostrar la regin donde los efectos de contorno estn presentes.

El valor 'Intervalo de muestra' se puede ajustar a un valor distinto de 1. Esto slo influir en la escala de las etiquetas en la parte x y y ejes.

176
El algoritmo se basa en convolucin rpida de la seal con el tren de ondas a diferentes escalas, utilizando la FFT.

Prueba de significacin: El nivel de significacin correspondiente a p = 0.05 pueden representarse grficamente como un contorno (prueba de ji cuadrada
de acuerdo con Torrence y Compo 1998). El valor retraso, tal como se indica por el usuario, especifica la hiptesis nula. Lag = 0 especifica un modelo

de ruido blanco. Valores 0 <Lag <1 especifica un modelo de ruido de color rojo con el MA dado (1) coeficiente de autocorrelacin. Se puede estimar

usando el mdulo ARMA en el men Hora (especificar trminos AR cero y un trmino MA, tenga en cuenta la MA valores se dan con signo negativo).

Si la opcin Power est seleccionada, el programa mostrar slo la parte real de la escalograma (no cuadrado). Esto muestra la
seal en el dominio del tiempo, se filtr a diferentes escalas.

En la ventana 'Vista nmeros', cada fila muestra una escala, con el nmero de la muestra (posicin) a lo largo de las columnas.

La transformada wavelet fue utilizado por Prokoph et al. (2000) para ilustrar ciclos en curvas de diversidad para foraminferos planctnicos. El
cdigo en el pasado se basa en Torrence y Compo (1998).

Referencia

Prokoph, A., AD Fowler & RT Patterson. 2000. La evidencia de la periodicidad y la no linealidad en un registro fsil de alta resolucin de

la evolucin a largo plazo. Geologa 28: 867-870.

Torrence, C. & GP Compo. 1998. Una gua prctica para de ondas de anlisis. Boletn de la Sociedad Americana de Meteorologa 79:

61-78.

177
espectro de eventos punto

Este mdulo, utilizando el mtodo de anlisis espectral circular (por ejemplo Lutz 1985) se utiliza para buscar la periodicidad en serie de eventos

puntuales tales como terremotos, erupciones volcnicas, y las extinciones en masa (por ejemplo Rampino y Caldeira 2015). Una sola columna de los

tiempos de eventos (por ejemplo, las fechas de las erupciones en millones de aos) se requiere. Los tiempos de los eventos no tienen que estar en

orden secuencial.

El mtodo funciona envolviendo la lnea de tiempo de alrededor de un crculo con una circunferencia correspondiente a un perodo de prueba PAG. Si los

puntos son PAG- peridica, van a agruparse en un cierto ngulo correspondiente a la fase. Las edades de los eventos t yo se convierten en ngulos un yo:

yo ta yo
2
P mod 2

Como en las estadsticas direccionales, los senos y cosenos de medias se calculan y se convierten a una magnitud media del vector (Rayleigh

estadstica) R y una fase de t 0:

1

NS unyo
pecado

NC cos 1unyo

2 RSE 2

1
moreno (Tomada al cuadrante correcto)
0
2 t CSP

178
R y t 0 se calculan para PAG que van desde el tiempo medio de espera hasta 1/3 de la duracin total de la serie, dando un espectro
completo.

Una lnea de significacin del 95% para R se calcula mediante un procedimiento de Monte Carlo con 1.000 repeticiones. los tiempos de eventos aleatorios

se calculan por una distribucin gamma para los tiempos de espera. El parmetro de forma se debe establecer en k = 1 (es decir, distribucin exponencial)

para un modelo nulo con ninguna interaccin entre los eventos (proceso de Poisson). Si se espera que los puntos estrechamente espaciados a ser raro,

se puede establecer k = 2 o k = 3.

Envolver la correccin: Lutz (1985) describi una correccin para nmero no entero de envolturas causando algunos puntos a ser

representado sobre-. Esta correccin, opcional en el pasado, le da un aspecto dentado de la curva espectral y parece que funciona mejor

para un nmero relativamente grande de puntos ( N> 20).

Armona: Este mtodo es como se ha plagado de armnicos como el anlisis de Fourier tradicional. Un pico espectral para un perodo PAG ser

acompaado por picos fuertes tambin en armnicos, es decir, en PAG/ 2, PAG/ 3, etc. Es importante tener esto en cuenta a la hora de interpretar el

espectro.

referencias

Lutz, TM 1985. El registro inversin magntica no es peridica. Naturaleza 317: 404-407.

Rampino, MR & K. Caldeira. 2015. peridicas de formacin de crteres de impacto y extincin de los niveles de los ltimos 260 millones de aos. Monthly

Notices de la Royal Astronomical Society 454: 3.480-3.484.

179
autocorrelacin

La autocorrelacin (Davis 1986) se lleva a cabo en una columna separada (s) de uniformemente muestreada

/ datos estratigrficos temporales. tiempos de retardo hasta norte/ 2, donde norte es el nmero de valores en el vector, se muestran a lo largo del eje x
(tiempos de retardo positiva slo - la funcin de autocorrelacin es simtrica en torno a cero). A predominantemente cero autocorrelacin significa
datos aleatorios - periodicidades aparecen como picos.

La opcin de "95 por ciento intervalo de confianza" se basar en lneas

1.
1 76
norte 3

despus de Davis (1986). Este es el intervalo de confianza de puntos aleatorios e independientes (ruido blanco). Hay dos cuestiones: El
ruido blanco es un modelo nulo poco realista, y el intervalo de confianza slo es estrictamente vlida en cada individual lag (mltiple
problema pruebas).

Los datos que faltan compatibles.

Referencia

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

180
autoasociacin

Autoasociacin es anloga a la autocorrelacin, pero para una secuencia de datos binarios o nominales codificados como nmeros enteros.

Para cada retardo, el valor autoasociacin es simplemente la relacin de hacer coincidir las posiciones de nmero total de posiciones
comparadas. El valor autoasociacin esperado (0,335 en el ejemplo anterior) para una secuencia aleatoria es (Davis 1986)

metro


2
k
n
XP
k

1

2
nn

dnde norte es el nmero total de posiciones, metro es el nmero de estados distintos (3 en el ejemplo anterior) y x k es el nmero de
observaciones en el estado de k.

Para retrasos no cero, una PAG valor se calcula a partir de slo las posiciones que se solapan, y el nmero esperado de coincidencias
entonces dada por E = NP. Esto se compara con el nmero observado de partidos O
para producir una 2 con 1 grado de libertad:

2 2
12 12

2

EEOEEO

con O '= no y mi '= norte( 1- PAG) el nmero observado y esperado de desajustes. Tenga en cuenta la correccin de Yates. La resultante pag valores

(de dos colas) se pueden mostrar como una funcin de retardo.

181
La cuestin se plantea mltiples pruebas para el conjunto de pag valores.

El ensayo anterior no es estrictamente vlida para las secuencias de transicin, donde no se permite repeticiones (la secuencia en el ejemplo
anterior es de este tipo). En este caso, seleccione la opcin No hay repeticiones. los pag
valores sern entonces calculadas por una prueba exacta, donde se calculan todas las posibles permutaciones sin repeticiones y la
autoasociacin en comparacin con los valores originales (una cola). Esta prueba va a tomar mucho tiempo para una duracin de n> 30, y la
opcin no est disponible para n> 40.

Los datos que faltan compatibles.

Referencia

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

182
La correlacin cruzada

La correlacin cruzada (Davis 1986) se lleva a cabo en dos columnas (s) de uniformemente muestreada

/ datos estratigrficos temporales. El eje x muestra el desplazamiento de la segunda columna con respecto a la primera, el eje y la
correlacin entre las dos series de tiempo para un desplazamiento dado. La opcin de "valores de p" dibujar la importancia de la
correlacin, despus de Davis (1986).

Para dos series temporales x y Y, el valor de correlacin cruzada en el tiempo de retraso metro es

r metro
yo
mi

yyxx
.

2 2
yo
mi

yyxx

Las sumas y los valores medios se toman solamente sobre las partes donde las secuencias se superponen para un tiempo de retardo determinado.

La ecuacin muestra que para retardos positivos, x se compara con un y que se ha retrasado por metro
muestras. Un valor alto de correlacin en positivo est por lo tanto significa que las caractersticas en y estn conduciendo, mientras x

va a la zaga. Para retardos negativos, las caractersticas de x estn conduciendo. Un recordatorio de esto se da por el programa.

los pag valor para un determinado metro est dada por una t prueba con norte- 2 grados de libertad, con norte el nmero de muestras que se

superponen:

2
metro 2
.
1 RNRT
metro

Es importante sealar que este criterio se refiere uno m particular. Trazado pag como una funcin de todos metro plantea la cuestin de las mltiples

pruebas - pag Se espera que los valores ms pequeos que 0,05 para el 5% de los tiempos de retardo incluso para completamente al azar (no

correlacionadas) conjuntos de datos.

En el ejemplo anterior, los terremotos datos parecen a la zaga de los datos de inyeccin, con un retraso de 0-2 muestras (meses en este
caso), donde los valores de correlacin son ms altos. los pag los valores (curva roja) indica significacin a estos desfases. Curiosamente,
tambin parece ser de importancia correlacin negativa a grandes retardos positivos y negativos.

Los datos que faltan compatibles.

Referencia

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

183
correlogram Mantel (y periodograma)

Este mdulo espera que varias filas de datos multivariados, una fila para cada muestra. Las muestras se supone que son espaciados de

manera uniforme en el tiempo.

El correlogram Mantel (por ejemplo Legendre y Legendre 1998) es una extensin multivariante para autocorrelacin, basndose en cualquier
medida de similitud o distancia. El correlogram Mantel en el pasado muestra el promedio de similitud entre las series de tiempo y una copia
tiempo lag, para diferentes retardos.

El periodograma de Mantel es un espectro de potencia de la serie temporal multivariante, calculada a partir de la correlogram Mantel
(Hammer 2007).

El escalograma Mantel es un trazado experimental de similitudes entre todos los pares de puntos a lo largo de la serie temporal. El
vrtice del tringulo es la similitud entre el primer y el ltimo punto. La base del tringulo muestra similitudes entre pares de puntos
consecutivos.

184
referencias

Hammer, . 2007. El anlisis espectral de una serie de mltiples especies tiempo Plio-Pleistoceno usando el periodograma de Mantel. Palaeogeography,
Paleoclimatologa, Paleoecologa 243: 373-377.

Legendre, P. & L. Legendre. 1998. Ecologa numrica, 2 ed Ingls. Elsevier, 853 pp.

185
prueba de rachas

La prueba de rachas es una prueba no paramtrica para la aleatoriedad en una secuencia de valores tales como una serie de tiempo. No
aleatoriedad puede incluir efectos tales como autocorrelacin, tendencia y periodicidad. El mdulo requiere una columna de datos, que se
convierten internamente a 0 ( x 0) o 1 ( x> 0).

La prueba se basa en una dicotoma entre dos valores ( x 0 o x> 0). Se cuenta el nmero de carreras (grupos de valores iguales
consecutivos) y la compara con un valor terico. Por tanto, la prueba de rachas se puede utilizar directamente para las secuencias de
datos binarios. Tambin hay opciones para corre alrededor de la media (el valor medio restan de los datos antes de la prueba), o
corre arriba y abajo (las diferencias de un valor al siguiente tomada antes de la prueba).

Con norte el nmero total de puntos de datos, norte 1 el nmero de puntos 0 y norte 2 el nmero de puntos> 0, el nmero esperado de
carreras en una secuencia aleatoria, y la varianza, son

RE 2 nnn

1 2
.
norte

R Var 1 2 1 nnnnn


2
22 .
2
nn 1

Con el nmero observado de carreras R, un z estadstica se puede escribir como

z RER

.
Var( R )

La resultante de dos colas pag valor no es preciso para n < por lo tanto, tambin se incluye 20. procedimiento A Monte Carlo, basado en 10000
repeticiones al azar utilizando el observado n, n 1 y norte 2.

186
tendencia prueba de Mann-Kendall

Una prueba no paramtrica para la tendencia. Requiere una sola columna de datos. Los valores perdidos se eliminan, y norte

ajustado convenientemente. El procedimiento sigue Gilbert (1987).

Datos x 1, ... x norte se supone que ser ordenado en secuencia de tiempo de recogida, o en sequence.Define espacial la funcin indicadora

, x si 0
1 sgn x
0, x si 0 .

1, x si 0

los S estadstica se calcula sumando sobre todos los pares de valores:

1
norte norte

S sgn xxij .
yo 1 ij 1

S ser negativo para una tendencia negativa, cero para ninguna tendencia, y positivo para una tendencia creciente.

por norte 10, la pag valor se toma de una tabla de valores exactos (Gilbert 1987). por n> 10, se utiliza una aproximacin normal,
como sigue.

Determinar el nmero total de grupos de lazos gramo y el nmero de valores atadas t j dentro de cada grupo, en la secuencia ordenada.
Entonces estimar la desviacin estndar de S por

gramo

1
1 18
2 5
SD jj 2tttnnn
1j 5 .
j1

los Z estadstica, es entonces

1
,
SD
SZ

que se utiliza para calcular pag a partir de la distribucin normal acumulativa como de costumbre. La resta de 1 es una correccin de continuidad.

Referencia

Gilbert, RO 1987. Mtodos estadsticos para el control de contaminacin del medio ambiente. Van Nostrand Reinhold, Nueva York.

187
ARMA (y anlisis de intervencin)

Anlisis y extraccin de las correlaciones de serie en serie de tiempo, y el anlisis del impacto de una perturbacin externa ( "intervencin") en un
punto particular en el tiempo. Asume series de tiempo estacionarias, a excepcin de una sola intervencin. Requiere una columna de datos
igualmente espaciados.

Este mdulo potente pero algo complicado implementa de mxima verosimilitud anlisis ARMA, y una versin mnima de anlisis de
intervencin de Box-Jenkins (por ejemplo, para investigar cmo un cambio climtico podra afectar a la biodiversidad).

Por defecto, se calcula un simple anlisis ARMA sin intervenciones. El usuario selecciona el nmero de AR (autorregresivo) y MA (media
mvil) trminos incluir en la ecuacin de diferencia ARMA. El logaritmo de la verosimilitud y criterio de informacin de Akaike se dan.
Seleccione el nmero de trminos que minimicen el criterio de Akaike, pero tenga en cuenta que los trminos AR son ms "poderoso" de
trminos MA. Dos trminos AR pueden modelar una periodicidad, por ejemplo.

El objetivo principal del anlisis ARMA es eliminar las correlaciones de serie, que de otra forma causan problemas para el modelo de ajuste y las

estadsticas. El residual debe ser inspeccionado en busca de signos de autocorrelacin, por ejemplo, copiando el residual de la ventana de resultados

numricos de vuelta a la hoja de clculo y utilizando el mdulo de auto-correlacin. Tenga en cuenta que para muchos conjuntos de datos

paleontolgicos con la escasez de datos y anlisis de los efectos de confusin, ARMA adecuada (y por lo tanto el anlisis de la intervencin) ser

imposible.

El programa se basa en el algoritmo de probabilidad de Melard (1984), combinado con la optimizacin no lineal multivariable
mediante la bsqueda simple.

anlisis de intervencin

anlisis de intervencin procede como sigue. En primer lugar, llevar a cabo el anlisis ARMA slo en las muestras anteriores a la intervencin,
escribiendo el ltimo nmero de la muestra previa a la intervencin en el cuadro de "ltima samp". Tambin es posible ejecutar el anlisis ARMA
slo en las muestras despus de la intervencin, escribiendo la primera muestra despus de la intervencin en el cuadro de "primera samp", pero
esto no es recomendable debido a la alteracin posterior a la intervencin. Tambin marque la casilla de "intervencin" para ver el modelo de
intervencin optimizado.

El anlisis sigue Box y Tiao (1975) en el supuesto de una "funcin de indicador" u (i) que es o bien un paso unidad o un pulso unidad, segn lo
seleccionado por el usuario. La funcin de indicador es transformada por un (1) Proceso de AR con un delta de parmetros y, a continuacin
reducido por una magnitud (en cuenta que la magnitud dada por el pasado es el coeficiente de la funcin de indicador transformado: primero hacer y
(i) = delta * y (i-1) + u (i), a continuacin, escala Y por la magnitud). El algoritmo se basa en la transformacin ARMA de la secuencia completa, y
luego una correspondiente transformacin ARMA de y, y la regresin lineal finalmente para encontrar la magnitud. El delta parmetro se optimiza
mediante la bsqueda exhaustiva sobre [0,1].

Para los pequeos impactos en los datos ruidosos, delta puede terminar en un sub-ptima. Tratar tanto el paso y opciones de pulso, y ver lo que
da ms pequeo error estndar de la magnitud. Adems, inspeccione los datos de optimizacin "Delta", en los que el error estndar de la
estimacin se representa como una funcin de la delta, para ver si el valor optimizado puede ser inestable.

188
El modelo Box-Jenkins puede modelar los cambios que son brusco y permanente (funcin de paso con delta = 0, o pulso
con delta = 1), brusco y no permanente (pulso con delta <1), o gradual y permanente (paso con delta <0).

Tenga cuidado con el error estndar de la magnitud - que a menudo se subestima, especialmente si el modelo ARMA no encaja
bien. Por esta razn, una pag valor deliberadamente no se calcula (Murtaugh
2002).

Los datos set de ejemplo (curva azul) es la curva de Sepkoski para ciento tasa de extincin en nivel de gnero desde el Silurian, interpolada
para un espaciamiento uniforme a ca. 5,5 millones de aos. El pico ms grande es la extincin lmite PermianTriassic. El usuario ha
especificado un modelo ARMA (2,0). El residual se representa en rojo. El usuario ha especificado que los parmetros ARMA deben ser
calculados para los puntos antes de la extincin PT en ranura de tiempo 34, y una intervencin de tipo pulso. El anlisis parece indicar una
constante de tiempo grande (delta) para la intervencin, con un efecto duradero en el Jursico.

referencias

Box, GEP y GC Tiao. 1975. Anlisis de Intervencin con aplicaciones a problemas econmicos y environental. Revista de la
Asociacin Americana de Estadstica 70: 70-79.

Melard, G. 1984. Un algoritmo rpido para la probabilidad exacta de los modelos autorregresivos promedio de movimiento.

Estadsticas aplicadas 33: 104-114.

Murtaugh, PA 2002. En las tasas de rechazo de anlisis de intervencin emparejado. Ecologa 83: 1752-1761.

189
Insolation modelo (solar forzando)

Este mdulo calcula insolacin solar en cualquier latitud y en cualquier momento a partir de 250 mA al reciente (los resultados son menos
precisos antes de los 50 Ma). El clculo se puede hacer por un "verdadero" longitud orbital, "significa" longitud orbital (correspondiente a una
fecha determinada en el ao), como promedio durante un mes determinado en cada ao, o integrado en todo un ao.

La puesta en prctica en el pasado ha sido portado a partir del cdigo de Laskar et al. (2004), por cortesa de estos autores. Por favor haga

referencia Laskar et al. (2004) en cualquier publicacin.

Es necesario especificar un archivo de datos que contiene los parmetros orbitales. Descargar el archivo desde
INSOLN.LA2004.BTL.250.ASC http://www.imcce.fr/Equipes/ASD/insola/earth/La2004 y poner en cualquier lugar en el equipo. La primera
vez que se ejecuta el clculo, PASADO pedir la posicin del archivo.

La cantidad de datos puede llegar a ser excesiva para los perodos de tiempo largos y cortos tamaos de paso!

Referencia

Laskar, J., P. Robutel, F. Joutel, M. Gastineau, ACM Correia y B. Levrard. 2004. Una solucin numrica a largo plazo para las
cantidades de insolacin de la Tierra. Astronoma y Astrofsica 428: 261-285.

190
eventos de punto

Espera una columna tiempos de eventos (por ejemplo, terremotos o divergencias clade) o posiciones que contiene a lo largo de una lnea (por ejemplo,

un corte transversal). Los tiempos no tienen que estar en orden creciente.

tendencia densidad (prueba de Laplace)

La prueba de Laplace para una evolucin de la densidad (intensidad) se describe por Cox & Lewis (1978). Se basa en la estadstica de prueba

Lt
U

2
L
12 1n

dnde t es la hora del evento media, norte el nmero de eventos y L la longitud del intervalo. L se estima como el tiempo desde el primero
hasta el ltimo evento, ms el tiempo medio de espera. T es aproximadamente distribuido normalmente con media cero y varianza unidad
bajo la hiptesis nula de intensidad constante. Esta es la base de lo dado pag valor.

Si p < 0,05, un positivo T indica una tendencia al aumento en la intensidad (disminuyendo los tiempos de espera), mientras que un negativo T indica una

tendencia a la baja. Tenga en cuenta que si la tendencia es detectado por esta prueba, la secuencia no es estacionaria y los supuestos de la prueba exp

continuacin se violan.

prueba Exp para el proceso de Poisson

La prueba exp (Prahl 1999) para un proceso de Poisson estacionario (al azar, eventos independientes) se basa en el conjunto de norte Tiempos de

espera t yo entre los eventos sucesivos en la secuencia ordenada. La estadstica de prueba es:

1

yo
1
tn M
yo
Tt T

191
dnde T es el tiempo medio de espera. METRO tender a cero para una secuencia regularmente espaciados (overdispersed), y a 1 para una

secuencia altamente agrupado. Para la hiptesis nula de un proceso de Poisson, METRO es asintticamente distribucin normal con media 1 / e - / norte

y la desviacin estndar / norte, dnde

= 0,189 y = 0,2427. Esta es la base de lo dado z prueba.

En resumen, si p < 0.05 la secuencia no es Poisson. A continuacin, puede inspeccionar el METRO estadstica; si es menor que el valor esperado
esto indica la regularidad, si es superior que indica la agrupacin.

Para ambas pruebas, pag valores tambin son estimadas por simulacin de Monte Carlo con 9999 conjuntos de datos aleatorios.

referencias

Cox, DR y PAW Lewis. 1978. El anlisis estadstico de una serie de eventos. Chapman y Hall, Londres.

Prahl, J. 1999. Un rpido prueba decir, sin binning en la agrupacin evento en procesos de Poisson. ArXiv, Astronoma y Astrofsica Septiembre de
1999.

192
cadena de Markov

Este mdulo requiere una sola columna que contiene una secuencia de datos nominales codificados como nmeros enteros. Por ejemplo, una
secuencia estratigrfica donde 1 significa piedra caliza, 2 significa esquisto y 3 significa arena. Se muestra una matriz de transicin que contiene los
recuentos o proporciones (probabilidades) de las transiciones de estado. Los desde -Estados estn en filas, los a -Estados en columnas.

Tambin es posible especificar varias columnas, que contienen cada uno una o ms transiciones de estado (dos nmeros para una transicin, norte

nmeros para una secuencia dando norte- 1 transiciones).

La prueba de ji cuadrado informa la probabilidad de que se tomaron los datos de un sistema con proporciones aleatorias de transiciones (es decir,
sin transiciones preferidos). Las transiciones con frecuencias anmalas pueden ser identificados mediante la comparacin de las matrices de
transicin observadas y esperadas.

El Embedded (sin repeticiones) opcin debe ser seleccionada si los datos se han recogido de una manera tal que no hay transiciones al
mismo estado son posibles (puntos de datos se recogen solamente cuando hay un cambio). La matriz de transicin tendr entonces
ceros en la diagonal.

Los algoritmos, incluyendo un algoritmo iterativo para cadenas de Markov incrustados, estn de acuerdo con Davis (1986).

Referencia

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

193
alisadores simples

Un conjunto de suavizadores sencillos para una sola columna de datos espaciados uniformemente.

Los datos que faltan son compatibles.

Media mvil

Sencillo norte- punto, centrado media mvil ( norte debe ser impar). de uso comn, pero tiene propiedades desafortunados tales como una

respuesta de frecuencia no montona.

gaussiano

media mvil ponderada utilizando un kernel gaussiana con desviacin estndar establecido a 1/5 del tamao de ventana (de norte puntos). Este

es probablemente el mejor mtodo general en el mdulo.

mediana en movimiento

Al igual que en la media mvil pero toma la mediana en lugar de la media. Este mtodo es ms robusto a los valores atpicos.

AR 1 (exponencial)

Recursive (autorregresivo) de filtro, y i = y yo- 1 + ( 1- ) x yo con un coeficiente de suavizado de 0 a 1. Esto corresponde a la media ponderada

con pesos de manera exponencial en descomposicin. Da un retraso de fase y tambin un transitorio en el comienzo de la serie.

Incluido para la integridad.

194
filtro FIR

El filtrado de ciertas bandas de frecuencia en una serie de tiempo puede ser til para suavizar una curva, retire variacin lenta, o enfatizar ciertas
periodicidades (por ejemplo, ciclos de Milankovitch). Se espera que una columna de datos espaciados uniformemente. Para la mayora de
aplicaciones en el anlisis de datos, es crucial que el filtro tiene la respuesta de fase lineal. por lo tanto, Past utiliza filtros FIR (Finite Impulse
Response), que estn diseados usando el algoritmo Parques-McClellan. Los siguientes tipos de filtros estn disponibles: paso bajo, paso alto, paso
banda y banda de detencin.

parmetros de filtro

Para disear un filtro ptimo toma un poco de esfuerzo. Las frecuencias se especifican en el rango de 0-0,5, es decir, T 0 / T

dnde T 0 es el intervalo de muestreo (no especificado a la computadora) y T es el perodo requerido. Por ejemplo, si el intervalo de
muestreo real es de 1.000 aos, una frecuencia correspondiente a un perodo de
23.000 aos se especifica como 1.000 / 23.000 = 0,043.

Despus de ajustar el tipo de filtro, hay que seleccionar un ancho de transicin (o deje el valor predeterminado de 0,02). Disminuir el ancho de
transicin har que un filtro ms ntida, a costa de ondulacin ms grande ( ondas en la respuesta de frecuencia).

Tenga en cuenta que los valores en los campos de texto no se actualizan hasta que se pulsa Intro. Adems, si se introduce una combinacin no vlida (por

ejemplo, una banda de transicin de cruzar 0 o 0.5, o lmite superior de menos de lmite inferior) el programa se restablecer algn valor para evitar

errores. Por lo tanto, es necesario introducir los nmeros en un orden para que el filtro es siempre vlida.

195
Los tipos de filtro son los siguientes:

1. Paso bajo. los De frecuencia se fuerza a cero. Frecuencias de hasta el A frecuencia de paso de la
filtrar. Las frecuencias de A + Transicin a 0.5 estn bloqueados.
2. Paso alto. los A frecuencia se ve obligado a 0,5. Las frecuencias por encima de la De frecuencia de paso de la
filtrar. Las frecuencias de 0 a De Transicin estn bloqueados.
3. De paso de banda. Las frecuencias de De a A pasar el filtro. Las frecuencias por debajo De Transicin
y por encima A + Transicin estn bloqueados.

4. Eliminador de banda. Las frecuencias de De a A estn bloqueados. Las frecuencias de 0 a De Transicin


y de A + Transicin a 0,5 pasar el filtro.

orden del filtro

El orden del filtro debe ser lo suficientemente grande como para dar un filtro aceptablemente agudo con ondulacin baja. Sin embargo, un filtro de longitud norte

dar resultados menos precisos en la primera y ltima norte/ 2 muestras de la serie del tiempo, que pone un lmite prctico en orden de filtro para series

cortas.

El algoritmo de Parques-McClellan no siempre converge. Esto da una respuesta de frecuencia obviamente incorrecto, y se trata de aplicar
un filtro a los datos dar un mensaje de advertencia. Trate de cambiar el orden del filtro (por lo general aumentarlo) para solucionar el
problema.

196
Fecha / tiempo de conversin

Utilidad para convertir fechas y / o de veces en una unidad de tiempo continuo para el anlisis. El programa espera una o dos columnas, cada una
con fechas u horas. Si ambos se dan, entonces el tiempo se aade a la fecha para dar el valor del tiempo final.

Las fechas pueden ser descritas en los formatos de ao / mes / da o da / mes / ao. Aos necesitan todos los dgitos (un ao determinado como 11

significarn 11 dC, no 2011). Slo las fechas del calendario gregoriano son compatibles. Los aos bisiestos son tomados en cuenta.

El tiempo puede ser dado como horas: minutos o horas: minutos: segundos (segundos pueden incluir decimales).

Las unidades de salida pueden ser aos (con el gregoriano ao media de 365,2425 das), da (de 86400 segundos), horas,
minutos o segundos.

La hora de inicio (tiempo cero) puede ser el momento ms pequeo, el comienzo del primer da, el comienzo del primer ao, el ao 0
(tenga en cuenta la convencin astronmica, donde el ao antes del ao 1 es el ao 0), o el a partir del primer da juliano (medioda,
ao -4712).

El programa funciona con tiempo simple (UT), que se define con respecto a la rotacin de la Tierra y con un nmero fijo de
segundos (86400) por da.

Si los datos de entrada consiste en los valores de fecha y hora, separados por espacios, como 2011/12/24 18: 00: 00.00, entonces puede que tenga

que utilizar la funcin Importar archivo de texto para leer los datos de tal manera que las fechas y veces se dividen en columnas separadas.

El clculo del da Juliano (que se utiliza para encontrar el nmero de das entre dos fechas) sigue Meeus (1991):

Si mes <= 2 comenzar ao: = ao - 1; mes: = mes + 12; fin;

A = piso( ao/ 100);

B = 2 - UN + piso( UN/ 4);

JD = piso (365.25 ( ao + 4716)) + suelo (30,6001 ( mes + 1)) + da + B - 1.524,5;

Referencia

Meeus, J. 1991. algoritmos astronmicos. Willmann-Bell, de Richmond.

197
men geomtrica

Direcciones (una muestra)

El mdulo de traza un diagrama de rosa (histograma polar) de direcciones. Para el trazado de especmenes orientada corrientes, orientaciones de

rastros, lneas de falla, etc. Tambin apropiado para el tiempo de los datos de da (0-24 horas).

Una columna de direccional (0-360) o de orientacin se espera (0-180) de datos en grados. datos direccionales o peridicas en otras
formas (radianes, horas, etc.) deben ser convertidos a grados usando por ejemplo el mdulo de expresin Evaluar (men Transform).

Por defecto, se elige el ngulo de la convencin 'matemtica' de sentido antihorario desde el este. Si utiliza la convencin 'geogrfica' de las
agujas del reloj desde el norte, marque la casilla.

Tambin puede elegir si desea tener las abundancias proporcionales al radio en el diagrama de rosa, o proporcional a la zona
(rea igual).

La opcin de "densidad de Kernel" traza una estimacin de densidad de ncleo circular.

Estadsticas descriptivas

El ngulo medio de circularidad toma en cuenta:

198

bronceado 1
(Tomada al cuadrante correcto).
pecado
cos ii

El intervalo de confianza del 95 por ciento en la media se calcula de acuerdo con Fisher (1983). Se supone la distribucin normal
circular, y no es preciso para varianzas muy grande (intervalo de confianza mayor que 45 grados) o tamaos de muestra pequeos. El
intervalo de confianza del 95% bootstrap en la media utiliza 5000 repeticiones de arranque. El grfico utiliza el intervalo de confianza
bootstrap.

El parmetro de concentracin se estima por aproximacin iterativa a la solucin para la ecuacin


RII
1

donde 0 y yo 1 son funciones de Bessel imaginarias de rdenes 0 y 1, que se estima de acuerdo con Press et al. (1992), y R se define a continuacin

(vase, por ejemplo Mardia 1972).

La prueba de Rayleigh para la distribucin uniforme

los R valor (longitud resultante media) est dada por:

2 2
norte norte
R cos yo pecado
yo .
norte
yo 1 yo 1

R se prueba ms contra una distribucin aleatoria mediante la prueba de Rayleigh para los datos de direccin (Davis
1986). Tenga en cuenta que este procedimiento se supone datos de manera uniforme o unimodal (von Mises) distribuye - la prueba no es adecuada

para, por ejemplo datos bimodales. los pag los valores son aproximados segn Mardia (1972):

2
n K R

2 2 3 4
K
n KK 132 24 4 2 1
76 ep 9 KKKK

2
288 norte

prueba de espaciado de Rao para la distribucin uniforme

prueba de espaciado de la Rao (Batschelet 1981) para la distribucin uniforme tiene estadstica de prueba

norte
1

2
TU
yo
,
yo 1

o o
dnde 360 . T
norte 1
iii
para i <n, T norte 360 1.
norte
Esta prueba es no paramtrico, y

no asume por ejemplo, distribucin von Mises. los pag valor se calcula por interpolacin lineal de las tablas de probabilidad
publicados por Russell y Levitin (1995).

199
Una prueba de Chi cuadrado para la distribucin uniforme tambin est disponible, con un nmero definido por el usuario de los contenedores

(por defecto 4).

del Watson T 2 de bondad de ajuste de prueba para la distribucin von Mises

Dejar F ser la distribucin von Mises para los parmetros estimados de ngulo medio y concentracin:

cos

; , EF
.
2 me
0

La estadstica de prueba (por ejemplo, Lockhart y Stevens 1985) es

2 2
2 1

2
yo 21
2 nznniz
12 1T

dnde


; , DFZ
yo

yo
0 ,

estimado por integracin numrica. Lmites de la estadstica de prueba se obtienen por interpolacin lineal en la Tabla 1 de
Lockhart y Stevens (1985). Ellos son aceptablemente precisa para n> = 20.

datos axiales

La opcin de 'orientaciones' permite el anlisis de las orientaciones (axial) lineales (0-180 grados). Las pruebas de Rayleigh y Watson se llevan
entonces hacia fuera en ngulos doblados (este truco es descrito por Davis 1986); la Chi-cuadrado utiliza cuatro contenedores de 0-180
grados; el diagrama de rosa refleja el histograma alrededor del origen.

referencias

Batschelet, E. 1981. Las estadsticas circulares en la biologa. Academic Press.

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

Fisher, NI 1983. Comentario en "Un mtodo para estimar la desviacin estndar de la direccin del viento".
Journal of Applied Meteorologa 22: 1971.

Lockhart, RA & MA Stephens 1985. Las pruebas de ajuste para la distribucin von Mises. Biomtrika 72: 647-
652.

Mardia KV, 1972. Estadsticas de los datos de direccin. Academic Press, Londres.

Russell, GS & DJ Levitin 1995. Una tabla de valores de probabilidad se expandi para la prueba de separacin de Rao.

Comunicaciones en Estadstica: Simulacin y Computacin 24: 879-888.

200
Direcciones (dos muestras)

El mdulo espera dos columnas de direccional (0-360) o (0-180) de datos orientacionales en grados.

prueba de Watson-Williams

La prueba de Watson-Williams para el ngulo de media igual en dos muestras es una prueba paramtrica, suponiendo una distribucin von
Mises, pero es bastante robusto. El parmetro de concentracin debe ser mayor que 1,0 para la prueba exacta. Adems, la prueba supone
variaciones angulares similares ( R valores).

Las dos muestras y tener norte 1 y norte 2 valores. difusin de Rayleigh R se calcula para cada muestra y para la muestra combinada:

2 2

norte
1
norte
1

R1
cos yo


yo
pecado

yo 1 yo 1

2 2

norte
2
norte
2

R 2

cos yo


yo
pecado

yo 1 yo 1

2 2

norte
1
norte
2
norte
1
norte
2

R

yocos cos yo

yosin sin yo
.
yo 1 yo 1 yo 1 yo 1

201
La estadstica de prueba T se calcula como

nU RRR
2 .
n 1 21 RR2

La significacin se calcula por primera correccin T de acuerdo con Mardia (1972a):

U
Rn 0. 45
2

81
1

T n
2
,

RU n 0. 95
1
8 3

dnde n = n 1+ norte 2. los pag valor viene dada entonces por la F de distribucin con 1 y norte- 2 grados de libertad. El parmetro de concentracin
combinada es de mxima probabilidad, calculada como se describe en Instrucciones (una muestra) anterior.

prueba Mardia-Watson-Wheeler

Esta prueba no paramtrica para la igualdad de la distribucin se calcula de acuerdo con Mardia (1972b).

SCW 2 2 2 SC
2 2
121

2 n

1
norte
2

donde, para la primera muestra,

norte
1 norte
1

do1 2
cos 1 yo N r
, S1 2
sen 1 yo N r
yo 1 yo 1

y lo mismo para la segunda muestra ( N = n 1+ norte 2). los r 1 yo son las filas de los valores de la primera muestra dentro de la muestra agrupada.

por N> 14, W es aproximadamente la chi-cuadrado con 2 grados de libertad.

referencias

Mardia, 1972a KV. Estadsticas de los datos de direccin. Academic Press, Londres.

Mardia, 1972b KV. A las puntuaciones uniformes multi-muestra de ensayo en un crculo y su competidor paramtrico.

Diario de la Real Sociedad de Estadstica de la Serie B 34: 102-113.

202
correlacin circular
Las pruebas para detectar la correlacin entre dos variables aleatorias direccionales o orientacionales. Asume nmero grande de las observaciones.

Requiere dos columnas de direccional (0-360) o (0-180) de datos orientacionales en grados.

Este mdulo utiliza el procedimiento de correlacin circular y prueba de significacin paramtrica de Jammalamadaka y
Sengupta (2001).

El coeficiente de correlacin circular r entre los vectores de ngulos y es

norte

sin
yosin yo

yo
r
1
,
norte

pecado
2 2
pecado yo yo

yo 1

donde se calculan los medios angulares como se describi anteriormente. La estadstica de prueba T se calcula como

norte norte


2 2
pecado k
pecado k

k 1 k1
T r .
norte

pecado
2 2
pecado k k

k1

Para grande norte, Esta estadstica tiene una distribucin asintticamente normal con media 0 y varianza 1 bajo la hiptesis nula de
correlacin cero, que es la base para el clculo de pag.

Referencia

Jammalamadaka, SR & A. Sengupta. 2001. Los temas de estadstica circular. World Scientific.

203
Esfrica (una muestra)

Este mdulo hace parcelas estreo de axial, datos esfricas (por ejemplo, mediciones huelga por inmersin en geologa estructural). estadsticas

esfricas se pueden aadir en futuras versiones.

Tres formatos de datos se pueden utilizar, todo ello utilizando la convencin geogrfica ngulo (grados, en sentido horario desde el norte):

Tendencia (acimut) y cada (ngulo hacia abajo desde la horizontal) para los datos axial

acimut Dip y el ngulo de inmersin (hacia abajo desde la horizontal) para aviones. El polo (vector normal) del plano se representa

grficamente.

Huelga y salsa para aviones, usando la convencin regla de la mano derecha con la cada abajo a la derecha de la
huelga. El polo al plano se traza.

el contorno de densidad se basa en un algoritmo modificado Kamb mtodo por el Vollmer (1995). Tanto rea igual (Schmidt) y las proyecciones
de igual ngulo (Wulff) estn disponibles. Las proyecciones son al hemisferio inferior. Las estimaciones de densidad pueden utilizar una zona
inversa, zona inversa al cuadrado o ley exponencial, dando cada vez ms elevados de suavizado.

Referencia

Vollmer, FW 1995. programa de C para el contorno automtica de datos de orientacin esfricas utilizando un mtodo Kamb
modificado. Computers & Geosciences 21: 31-49.

204
anlisis del patrn de punto - vecinos ms cercanos

Este pruebas de mdulo para la agrupacin o sobredispersin de puntos dados como bidimensional valores de coordenadas. El procedimiento se
supone que los elementos son pequeas en comparacin con sus distancias, que el dominio es predominantemente convexa, y n> 50. Dos
columnas de x / y se requieren posiciones. Las aplicaciones de este mdulo incluyen ecologa espacial (estn in-situ braquipodos agrupados),
morfologa (son tubrculos trilobites overdispersed), y la geologa (distribucin de, por ejemplo volcanes, terremotos, resortes).

El clculo de las estadsticas de distribucin de puntos utilizando el anlisis del vecino ms cercano sigue Davis (1986) con modificaciones. El
rea se calcula ya sea por el rectngulo ms pequeo que encierra o el uso de la envolvente convexa, que es el polgono convexo ms
pequeo que encierra los puntos. Ambos son inapropiados para puntos en dominios muy cncavas. Dos mtodos de ajuste de efecto de borde
diferentes estn disponibles: envolvente ( "toro") y la correccin de Donnelly. Envolvente de la deteccin de bordes slo es apropiado para
dominios rectangulares.

La hiptesis nula es un proceso de Poisson al azar, dando una distribucin exponencial modificada vecino ms cercano (ver ms abajo)
con media

An /

2

dnde UN es el rea y norte el nmero de puntos.

La probabilidad de que la distribucin es Poisson se presenta, junto con el R valor:

205
2

A DD R n

dnde re es la distancia media observada entre los vecinos ms cercanos. puntos agrupados dan R < 1, patrones de Poisson dan R ~ 1,
mientras que los puntos overdispersed dan R> 1.

La distribucin esperada (terico) bajo la hiptesis nula se representa grficamente como una curva continua junto con el histograma de
distancias observadas. La funcin de densidad de probabilidad esperada como una funcin de la distancia r es

rrrg
exp 2
2

dnde = n / A es la densidad de puntos (Clark y Evans 1954).

, Tambin se incluyen las orientaciones (0-180 grados) y las longitudes de lneas entre los vecinos ms cercanos. Las orientaciones pueden
ser sometidos a anlisis direccional para probar si los puntos se organizan a lo largo de lineamientos (ver Hammer 2009 para los mtodos
ms avanzados).

referencias

Clark, PJ & Evans, FC 1954. Distancia al vecino ms cercano como una medida de las relaciones espaciales en las poblaciones. Ecologa 35:
445-453.

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

Hammer, . 2009. Nuevos mtodos para el anlisis estadstico de las alineaciones de puntos. Computers & Geosciences 35:
659-666.

206
Ripley K anlisis del patrn de punto

Ripley K ( Ripley 1979) es la densidad de puntos de promedio como una funcin de la distancia desde cada punto. Es til cuando Caractersticas del

patrn de punto de cambio con la escala, por ejemplo sobredispersin sobre pequeas distancias pero la agrupacin a travs de grandes distancias. Dos

columnas de x / y Se espera que las coordenadas de un dominio rectangular.

Definir la intensidad estimada del patrn de punto, con norte los puntos en un rea UN, como Un. los
distancia entre los puntos yo y j es re ij La estimacin de Ripley K, como una funcin de la distancia, se calcula entonces como

1
norte



I ND K ij
dd ,
yo 1 ij

donde la funcin de indicador yo es uno si el argumento es cierto, cero en caso contrario.

La normalizacin de las K es tal que para la aleatoriedad espacial completa (RSC), K (d) se espera que aumente ya que la zona de
2
crculos, es decir, K dd . los L (d) funcin es una transformacin correspondiente
de K (d):

LdK d

Para que la RSE, L (d) = d, y L (d) -d = 0. Un intervalo de confianza del 95% para la RSE se estima utilizando 1000 simulaciones de Monte Carlo dentro

del rectngulo delimitador (versiones anteriores utilizan la aproximacin 1. 42 A n /).

207
correccin de borde de Ripley se incluye, dando pesos a los recuentos en funcin de la proporcin del crculo de prueba que est dentro del
dominio rectangular.

El ejemplo anterior muestra ubicaciones de tuberas volcnicas. L (d) -d est por debajo del intervalo de confianza del 95% de la RSE, indicando la
inhibicin lateral, hasta una distancia de ca. 70 m. Para distancias ms grandes, la curva se aplana en la forma esperada de la RSC.

Zona

Para el clculo correcto de Ripley K, la zona debe ser conocido. En la primera carrera, el rea se calcula utilizando el ms pequeo rectngulo
delimitador, pero esto puede tanto sobre y subestimar el rea de bienes. Por tanto, el rea se puede ajustar por el usuario. Una superficie
sobredimensionada normalmente se mostrar como una tendencia lineal global fuerte, con pendiente positiva para L (d) -d.

Dimensin fractal

La dimensin fractal (si los hay) se puede estimar como la pendiente lineal asinttica en un grfico log-log de K (d).
Para CSR, la pendiente log-log debe ser 2.0. Fractales deben tener pistas de menos de 2.

referencias

Ripley, BD 1979. Las pruebas de 'aleatoriedad' para modelos de puntos espaciales. Revista de la Royal Statistical Society, ser. segundo 41:

368-374.

208
la densidad del ncleo

Hace una transformacin suave de la densidad de punto en 2D. Dos columnas de x / y Se espera que las coordenadas de un dominio rectangular. El
usuario puede especificar el tamao de la red (nmero de filas y columnas). El valor de Radio establece la escala r del ncleo. Actualmente no existe
una seleccin automtica de radio ptima, por lo que este valor debe ser establecido por el usuario en funcin de la escala de inters.

La estimacin de la densidad se basa en una de las cuatro funciones de ncleo, con el parmetro radio r. Con

2 2
yo
yo
:
yyxxd
yo

F , exp 1
yo
Gaussiana (por defecto):

rd
2 2
Ryx yo 2

rdrd
2
paraboloide: F , 2

Ryx 1 2 3
0
yo
iii
rd


rdrd
Triangular: F , 2 12
Ryx
yo
0 iii
rd

rdryx
Uniforme: F , 2 1 1 0 rd
yo ii

209
La escala da una estimacin del nmero de puntos por rea, no una densidad de probabilidad. Los granos gaussianos y paraboloide
(cuadrticas) por lo general funcionan mejor. El ncleo uniforme da muy baja suavidad.

alineaciones de puntos

La deteccin de alineaciones lineales en un patrn de punto 2D, utilizando el mtodo de sector continua (Hammer
2009). Las aplicaciones tpicas son en geologa y geografa, para estudiar la distribucin de terremotos, volcanes, aguas etc.
asociados con defectos y otras estructuras lineales.

los Radio parmetro establece la escala de anlisis. En el ejemplo anterior, se detectan lineamientos de longitud 1,200 m (dos veces el
radio).

Alfa establece el nivel de significacin para la prueba de Rayleigh utilizado por el procedimiento. Tenga en cuenta que este es un significado
puntual, no corregido para las mltiples pruebas de todos los puntos.

los filtro de dispersin desactiva alineaciones con distribucin irregular de puntos a lo largo del lineamiento.

Ver los nmeros enumera las posiciones de alineacin y de sus orientaciones, que se pueden someter a las estadsticas circulares si es necesario
(mdulo de direcciones).

Referencia

Hammer, . 2009. Los nuevos mtodos para la deteccin estadstica de las alineaciones de puntos. Computers & Geosciences 35: 659-666.

210
conteos de cuadrantes

Este mdulo proporciona estadsticas sobre la distribucin de los puntos en los cuadrantes. Los datos de entrada consisten en una nica columna de

recuentos de puntos en cuadrantes de igual tamao (el orden es arbitrario). Para un patrn de punto al azar, se espera que los datos que siguen una

distribucin de Poisson.

Se espera que el ndice de Morisita (Morisita 1959) que tienen un valor Id = 1 para un patrn aleatorio, Id < 1 para un patrn overdispersed

(espacio), y id> 1 (hasta Id = norte) para un patrn agrupado. Se calcula de la siguiente manera:

XXII yo

,

2
xx

dnde norte es el nmero de cuadrantes, y x son los recuentos. La prueba de significacin sigue Morisita (1959), con F proporcin


SI 1 XNX
0
.
1
norte

Los grados de libertad son norte- 1 y . Adems, una prueba de Monte Carlo se lleva a cabo con 9999 rplicas, cada una con

distribucin aleatoria de puntos en cuadrantes.

Los lmites de confianza del 95% (inferior y superior) alrededor Id = 1 (patrn al azar) se llaman el uniforme y los ndices aglutinadas,

respectivamente (Krebs 1999):


2 975
0.
xn
u
METRO
x 1


2 025
0.
xn
do
METRO
x 1

donde 20.975 es el punto de la distribucin chi-cuadrado con 97,5 percentil norte- 1 grados de libertad.

El ndice de Morisita estandarizada, MAL, fue sugerido por Smith-Gill (1975). Se extiende de -1 a 1, con
MIS = 0 para un patrn aleatorio y con 95% de lmites de confianza [-0.5, 0.5]. Se calcula como sigue:


MI

MI
do
0: 1
MIS . 0 5. 5
n M cc




0: 1 . (Esta ecuacin es incorrecta en algunos documentos)
do
MIS IM 15
MI do 1



1 MIu MIS 0:
.
15
MI u 1

211

u
1 u
IM MIS
0: . 0 5. 5
MMI
u

referencias

Krebs, CJ 1999. Metodologa ecolgica, 2 Dakota del Norte ed. Benjamin Cummings Editores.

Morisita, M. 1959. Medicin de la dispersin de los individuos y el anlisis de los patrones de distribucin. Memorias de la

Facultad de Ciencias, Universidad de Kyushu, la Serie E (biologa) 2: 215-235.

Smith-Gill, SJ 1975. Cytophysiological base de los patrones de pigmentacin perturbadores de la rana leopardo,

Rana pipiens. II. de tipo salvaje y patrones especficos de clulas mutantes. Journal of Morfologa 146: 35-54.

Autocorrelacin espacial (I de Moran)

autocorrelacin espacial en el pasado requiere tres columnas, que contiene x y y coordenadas y valores de datos correspondientes z para un nmero
de puntos. de Moran yo Estadstica de correlacin se calcula a continuacin, dentro de cada uno de un nmero de clases de distancia (bins), que van
desde pequeas a grandes distancias.

El valor crtico de una cola para p < 0.05 pueden representarse grficamente para cada bin. Moran yo valores que exceden el valor crtico pueden
ser considerados significativos, pero Bonferroni u otro ajuste para mltiples pruebas deben ser considerados por los varios compartimientos.

212
El clculo sigue Legendre y Legendre (1998). Para cada clase de distancia re, calcular

norte norte
1
W d I hi h
yo

zzzzw
1 1 yo

marido
.
norte
1

2
yo

ZZN
yo 1

Aqu, norte es el nmero total de puntos, W es el nmero de pares de puntos que tienen distancias dentro de la clase de distancia, y w Hola una funcin de

ponderacin de tal manera que w hi = 1 si los puntos marido y yo se encuentran dentro de la clase de distancia y w hi = 0 en caso contrario (delta de Kronecker).

Tenga en cuenta que esta ecuacin es incorrecta en algunas publicaciones.

Para el nivel crtico de una cola yo 0.05, calcular

norte
1

2
S1 hi ww
ih

2 1 1 yo
marido


2
2
S en
ww yo
yo 1


4
en

zznb
yo 1
2
2

norte


2
en zz
yo 1
2
3 3 SnS3nS nnb W
S I nnn
22
2
1
22 6W
2
1
var
1 2

2 2
W2 1 3 nnn norte
1
1
yo0. 05 1. 6452var nk0. 05 me 1

Aqu el w i + y w + yo son las sumas de fila y columna. El factor de correccin k 0.05 se establece en

0 10
. 0 05. 707 Si 4 nn W 3 2 4 nn
1 , de lo contrario k 0,05 = 1.

Referencia

Legendre, P. y Legendre, L. 1998. numrica Ecologa, 2 ed Ingls. Elsevier, 853 pp.

213
Grillado (interpolacin espacial)

Grillado es la operacin de interpolacin espacial de puntos de datos 2D dispersos en una rejilla regular. Se requieren tres columnas
con la posicin (x, y) y valores de datos correspondientes.

Gridding permite la produccin de un mapa que muestra una estimacin espacial continua de alguna variable aleatoria como la abundancia de fsiles o

el grosor de una unidad de roca, sobre la base de puntos de datos dispersos. El usuario puede especificar el tamao de la red (nmero de filas y

columnas). La cobertura espacial del mapa se genera automticamente como un cuadrado que cubre los puntos de datos. Cuando el trazado, esto

puede ser reducido a la envolvente convexa de los puntos.

A mnimos cuadrados superficie lineal (tendencia) est equipado de forma automtica a los datos, se retiran antes de la gridding y finalmente
vuelve a aadir en. Esto es principalmente til para el modelado semivariogram y el mtodo kriging.

Validacin cruzada: Esta opcin eliminar cada punto de datos en la vuelta y volver a calcular la superficie en base a los puntos restantes (
navaja de bolsillo). Las diferencias entre los valores de datos originales y los valores de validacin cruzada indican la precisin de la
prediccin del modelo de superficie. se reportan estas diferencias para cada punto, junto con el error cuadrtico medio (MSE) sobre todos los
puntos.

Cuatro algoritmos de interpolacin estn disponibles:

ponderacin de distancia inversa


El valor en un nodo de red es simplemente el promedio de la norte puntos de datos ms cercanos, segn lo especificado por el usuario (por defecto es
el uso de todos los puntos de datos). Los puntos son ponderados en proporcin inversa a la distancia. Este algoritmo es rpido, pero no siempre dan
buenos resultados (lisos). Un artefacto tpico es ojos de buey en torno a los puntos de datos. Una ventaja es que los valores interpolados nunca
exceder el rango de la

214
puntos de datos. Configurando N = 1, este algoritmo se reduce a la mtodo del vecino ms prximo, que establece el valor en un nodo de red para el
valor del punto de datos ms cercano.

spline Thin-placa
interpolador mximamente liso. Puede sobrepasar en presencia de curvas cerradas en la superficie. Este es un mtodo de base radial con
funcin de base radial = r En r.

Multiquadric
Funcion de base radial = r. Popular para modelar el terreno.

kriging
Se requiere que el usuario especifique un modelo para el semivariogram, por la eleccin de uno de los cuatro modelos comunes y los parmetros que se

ajustan a los semivariances empricos correspondiente (la suma de cuadrados residual debe ser tan pequea como sea posible). El semivariogram se

calcula en cada uno de un nmero de contenedores. Utilizando la opcin de histograma, elegir un nmero de contenedores de manera que cada bin

(excepto, posiblemente, los ms a la derecha) contiene al menos 30 distancias.

los pepita parmetro es una constante aadido al modelo. Esto implica una variacin distinta de cero en la distancia cero, y por lo tanto va a permitir
que la superficie no pasa exactamente a travs de los puntos de datos dados. los
distancia controla el grado de la curva a lo largo del eje distancia. En las ecuaciones siguientes, el valor de la distancia normalizada marido representa
distancia / gama. los escala controla el grado de la curva a lo largo del eje de la varianza.

3
pepita de escala h hhh
Esfrico:
12123
pepita
de escala 1
marido

Exponencial:
de escala1 h e
pepita


marido


2


marido
gaussiano: de escala1 h e
pepita

2 3
8 7 de. escala h3 75 .
pepita
5
0 5 .
7

hhhhh
Cbico: 1 75
pepita de
escala 1
marido

El botn Optimizar todo seleccionar el modelo y los parmetros que da la suma residual de cuadrados ms pequeos en el semivariograma.
Esto puede no ser lo que quiere: Por ejemplo, usted puede desear utilizar un modelo especfico o tener cero pepita con el fin de garantizar la
interpolacin exacta. Para ello ser necesario establecer los valores manualmente.

El procedimiento kriging tambin proporciona una estimacin de los errores estndar de todo el mapa (esto depende del modelo
semivariogram ser exacto). Kriging en el pasado no prev semivarianza anisotrpico.

Advertencia: Kriging es lento, no intente por ms de ca. 1000 puntos de datos en una cuadrcula de 100x100.

215
Vase, por ejemplo Davis (1986) o de Smith et al. (2009) para ms informacin sobre cuadriculado.

referencias

Davis, JC 1986. Las estadsticas y anlisis de datos en la geologa. John Wiley & Sons.

de Smith, MJ, MF Goodchild & PA Longley. 2009. Anlisis Geoespacial, 3 rd ed. Matador.

216
Multivariante Alometra AN NO EN EL PASADO 3

Este mdulo se utiliza para la investigacin de alometra en un conjunto de datos morfomtricos multivariante. Se espera que un conjunto de datos

multivariados establecidos con variables (mediciones de distancia) en las columnas, las muestras en filas.

Este mtodo para la investigacin de alometra en un conjunto de datos multivariable se basa en Jolicoeur (1963) con extensiones por

Kowalewski et al. (1997). Los datos son (automticamente) log-transformado y se sometieron a PCA. El primer componente principal (CP1)

es entonces considerado como un eje tamao (esto slo es vlido si la variacin explicada por PC1 es grande, digamos ms del 80%). El

coeficiente alomtrico para cada variable original se calcula dividiendo la carga PC1 para esa variable por la carga PC1 media sobre todas

las variables.

los intervalos de confianza del 95% para los alometras se estiman por bootstrapping especmenes. 2000 repeticiones de arranque

se realizan.

datos que faltan es apoyado por sustitucin promedio de la columna.

referencias

Jolicoeur, P. 1963. La generalizacin multivariante de la ecuacin alometra. biometra 19: 497-499.

Kowalewski, M., E. Dyreson, JD Marcot, JA Vargas, KW Flessa y DP Hallmann. Fentica 1997. discriminacin de los simplones
biomtricos: implicaciones paleobiolgicas de morfoespecies en el braquipodo lingulide Glottidia. paleobiologa 23: 444-469.

217
PCA de puntos de referencia en 2D (urdimbres relativa)

Este mdulo es muy similar al mdulo estndar PCA, pero con algunas funciones adicionales para el anlisis de hito
configuraciones 2D. Los datos esperados son ejemplares en filas, alternando x y y
Las coordenadas de las columnas. Procusto estandarizacin recomienda.

Las urdimbres relativos (componentes principales) estn clasificadas segn su importancia, y el primer y segundo hilos de urdimbre son
generalmente los ms informativo. Tenga en cuenta que este mdulo hace un PCA directa de los puntos de referencia, lo que significa que el
componente afn est incluido en el anlisis.

Las urdimbres relativas se visualizaron con vectores y / o rejillas de transformacin spline de placa delgada. Al aumentar o disminuir el
factor de puntuacin lejos de cero, la configuracin de punto de referencia original y la rejilla se deformarn progresivamente de acuerdo a
la urdimbre relativa seleccionada. Los vectores se han extrado de la media a la (punto) posicin hito deformado.

218
splines Thin-placa para puntos de referencia 2D

Este mdulo muestra una deformacin de la forma de una configuracin de punto de inters a otro. Los datos esperados son ejemplares
en filas, alternando x y y Las coordenadas de las columnas. Procusto estandarizacin recomienda.

Cualquier forma seleccionada en el men De forma, se toma como referencia, con una rejilla cuadrada asociado. Las urdimbres de esto a
todas las dems muestras se pueden ver. Tambin puede elegir la forma media como la referencia.

La opcin 'factores de expansin' mostrar la expansin de la superficie (o contraccin) factor de alrededor de cada punto de referencia en nmeros

de color amarillo, lo que indica el grado de crecimiento local. Esta se calcula utilizando el Jacobiano de la urdimbre. Tambin, las expansiones estn

codificados por color para todos los elementos de la red, con el verde para la expansin y prpura para la contraccin.

En cada punto de referencia, los principales cepas tambin se pueden mostrar, con la mayor tensin en la cepa negro y menor en marrn. Estos
vectores indican direccional estiramiento.

Una descripcin de de placa delgada rejillas transformacin spline est dada por Dryden y Mardia (1998).

Referencia

Dryden, IL y KV Mardia 1998. Anlisis de la forma de Estadstica. Wiley.

La regresin lineal de puntos de referencia 2D

Espera especmenes en filas, con una sola columna de datos independientes (por ejemplo, tamao), seguido de pares de columnas con
posiciones seal armarios-Procrustes. La produccin incluye rejillas de deformacin y vectores de desplazamiento, extrados de la media para los
(puntos) posiciones de hitos deformados.

219
PCA de monumentos en 3D

Los especmenes en filas, monumentos en 3D en tripletes de columnas (debe ser Procrustes equipada primero). El mdulo es similar al
mdulo estndar PCA, pero permite la visualizacin de los componentes principales como vectores 3D (flechas) de distancia de la
configuracin media.

220
Tamao de puntos de referencia (2D o 3D) AN NO EN EL PASADO 3

digitalizada x / y o x / y / z coordenadas histricas. Las muestras en filas, coordina con la alternancia de X e Y (y z para 3D) valores en las
columnas. No se debe Procusto equipado o normalizado para el tamao!

Calcula el tamao de centroide para cada muestra (norma euclidiana de las distancias de todos los puntos de referencia al centroide).

Los valores de la columna 'normalizado' son tamaos centroide dividido por la raz cuadrada del nmero de puntos de referencia - esto podra ser
til para comparar las muestras con diferentes nmeros de puntos de referencia.

normalizar tamao

La opcin 'tamao Normalizar' en el men Transform le permite eliminar tamao dividiendo todos los valores de las coordenadas del
baricentro tamao de cada muestra. Para los datos 2D en su lugar puede utilizar coordenadas Procrustes, que tambin estn
normalizados con respecto a su tamao.

Ver Dryden y Mardia (1998), p. 23-26.

Referencia

Dryden, IL y KV Mardia 1998. Anlisis de la forma de Estadstica. Wiley.

221
Distancia de puntos de referencia (2D o 3D) AN NO EN EL PASADO 3

digitalizada x / y o x / y / z coordenadas histricas. Las muestras en filas, coordina con la alternancia de X e Y (y z para 3D) valores en las
columnas. Pueden o no ser Procrustes equipado o normalizado para el tamao.

Calcula las distancias euclidianas entre dos puntos de referencia fijos para uno o varios ejemplares. Debe elegir dos puntos de
referencia - estos se denominan de acuerdo con el nombre de la primera columna para el hito ( x valor).

Todas las distancias de hitos (EDMA) todava no est en ltimos 3

digitalizada x / y o x / y / z coordenadas histricas. Las muestras en filas, coordina con la alternancia de X e Y (y z para 3D) valores en las
columnas. Pueden o no ser Procrustes equipado o normalizado para el tamao.

Esta funcin reemplazar los datos de la seal en la matriz de datos con un conjunto de datos que consta de las distancias entre todos los pares de

puntos de referencia, con un espcimen por fila. El nmero de pares es N (N-1) / 2 para norte

puntos de referencia. Esta transformacin permite el anlisis multivariante de datos de distancia, que no son sensibles a la rotacin o traslacin de
los especmenes originales, por lo que un accesorio Procrustes no es obligatorio antes de dicho anlisis. El uso de datos de distancia tambin
permite log-transformacin, y el anlisis de ajuste a la ecuacin alomtrica para pares de distancias.

datos que faltan es apoyado por sustitucin promedio de la columna.

Punto de referencia que une AN NO EN EL PASADO 3

Esta funcin en el men Geomet permite la seleccin de cualquier par de puntos de referencia para vincularse con las lneas en las parcelas

morfomtricos (splines de placa delgada, deformaciones parciales y relativos, etc.), para mejorar la legibilidad. Los puntos de referencia deben estar

presentes en la hoja de clculo principal antes enlaces pueden ser definidos.

Los pares de puntos de referencia se seleccionan o deseleccionados haciendo clic en la matriz simtrica. El conjunto de enlaces tambin se pueden

guardar en un archivo de texto. Tenga en cuenta que hay poca comprobacin de errores en este mdulo.

222
anlisis elptica forma Fourier

requiere digitalizada x / y coordina alrededor de los contornos. Las muestras en las filas, las coordenadas de alterna x
y y valores de las columnas. anlisis elptica forma Fourier es en varios aspectos superior a la simple anlisis de la forma de Fourier. Una
ventaja es que el algoritmo puede manejar formas complicadas que pueden no ser expresable como una funcin nica en coordenadas
polares. formas de Fourier elpticas es ahora un mtodo estndar de anlisis de contorno. El algoritmo utilizado en el pasado es descrito por
Ferson et al. (1985).

coeficientes de la EPT

Coseno y componentes sinusoidales de x y y incrementos a lo largo del contorno de los primeros 30 armnicos se dan, pero slo la primera NORTE/
2 armnicos deben utilizarse, donde norte es el nmero de puntos digitalizados. El tamao y la traduccin posicional se normalizan de
distancia, y no entran en los coeficientes. El tamao (antes de la normalizacin) se da en la primera columna. La normalizacin opcional para
la rotacin o el punto de partida, siguiendo Ferson et al., A veces voltea formas alrededor. Esto se debe comprobar con el 'punto de vista de la
forma' (ver ms abajo) - puede ser necesario para eliminar dichos especmenes.

Los coeficientes se pueden copiar en la hoja de clculo principal para su posterior anlisis como el anlisis discriminante.

La ventana de la forma vista 'permite la visualizacin grfica de la aproximacin forma Fourier elptica (s).

EPT PCA

Anlisis de componentes Principal de los coeficientes de la EPT de los contornos determinados, con la visualizacin de los componentes principales

como deformaciones de la EPT. Para ms detalles sobre la PCA en el pasado, consulte la descripcin del PCA.

Referencia

Ferson, SF, FJ Rohlf y RK Koehn. variacin de la forma 1985. Medicin de contornos bidimensionales.
Zoologa sistemtica 34: 59-68.

223
anlisis de la forma Hangle Fourier

requiere digitalizada x / y coordina alrededor de los contornos. Las muestras en las filas, las coordenadas de alterna x
y y valores de las columnas.

El mtodo Hangle para el anlisis de contornos cerrados, propuestos por Haines & Crampton (2000) es un competidor de elptica anlisis
de Fourier. Hangle tiene ciertas ventajas sobre la EPT, el ser ms importante que se necesitan menos coeficientes para capturar el borde
a una precisin dada. Esto es de importancia para la prueba estadstica (por ejemplo, MANOVA) y el anlisis discriminante. La puesta en
prctica en el pasado se basa en el paquete Hangle / Hmatch / rbol HTree / Hshape de Haines y Crampton (gracias a los autores para
proporcionar el cdigo fuente).

La salida consta de 46 coeficientes de Fourier, que son los cos y coeficientes pecado de los primeros 24 armnicos (modos), a partir del
armnico nmero 2. Copia estos nmeros de nuevo a una hoja de clculo Past para su posterior anlisis forma multivariante.

Punto de partida de normalizacin

Por lo general, salir a 'Match todos', ya sea con el 'Hmatch' o (quiz preferentemente) el mtodo de 'rbol HTree' para alinear todos los contornos.

Alternativamente, seleccione 2.-4. armnica, que por desplazamiento de fase de cada esquema de acuerdo con el modo seleccionado (ver Haines &

Crampton 2000).

alisando

Incrementar el parmetro de suavizado puede reducir el ruido de alta frecuencia, a costa de amortiguacin de informacin de forma de alta
frecuencia potencialmente informativo.

forma vista

Utilice esta funcin para inspeccionar las formas reconstruidas a partir de los coeficientes de Fourier. Compruebe que la rutina correspondiente no
ha girado cualquier forma incorrecta. Adems, utilice esta funcin para seleccionar el nmero mnimo de los modos necesarios para la captura de la
forma. En el ejemplo anterior, el nmero de modos se ha establecido en 14, que captura 99,88% de la potencia total integrada (amplitud al
cuadrado) de la forma seleccionada. El nmero de modos se muestra por la lnea roja en el espectro de potencia - asegrese de que las principales
caractersticas del espectro se encuentran a la izquierda de esta lnea para todas las formas.

Nota: PCA visualizacin y la regresin (como para la EPT) an no ha sido implementado para Hangle.

Referencia

Haines, AJ y JS Crampton. 2000. Las mejoras en el mtodo de anlisis de la forma de Fourier como se aplica en estudios
morfomtricos. Paleontologa 43: 765-783

224
transformacin de coordenadas

La conversin entre las coordenadas geogrficas en diferentes redes y puntos de referencia. El nmero de columnas de entrada depende del tipo de

datos, como se describe a continuacin.

Grados decimales (WGS84)

Dos columnas: latitud y longitud, en grados decimales (60.5 es de 60 grados, 30 minutos). Los valores negativos para el sur
de ecuador y al oeste de Greenwich. Referida al cero WGS84.

Deg / minutos decimales (WGS84)

Cuatro columnas: grados de latitud, deci minutos mal (40.5 es de 40 minutos, 30 segundos), grados de longitud,
minutos decimales. Referida al cero WGS84.

Deg / min / sec (WGS84)

Seis columnas: grados de latitud, minutos, segundos, grados de longitud, minutos, segundos. Referida al cero WGS84.

UTM-ED50 (Intl 1924)

Tres columnas: X local (metros), Norte (metros), y de zona. Utilizar los nmeros de zona negativos para el hemisferio
sur. El manejo de zonas UTM tiene en cuenta los casos especiales de Svalbard y el oeste de Noruega. Referida al cero
Europea ED50 en Potsdam.

UTM-WGS84 (WGS84)

Tres columnas: X local (metros), Norte (metros), y de zona. Referida al cero WGS84.

UTM-NAD27 (Clarke 1866)

Tres columnas: X local (metros), Norte (metros), y de zona. Referida al cero NAD27. La conversin a / desde este
formato es ligeramente inexactos (5-6 metros).

UTM-NAD83 (GRS80)

Tres columnas: X local (metros), Norte (metros), y de zona. Refieren al punto cero NAD83 (prcticamente idntica a
WGS84).

Suecia (RT90)

Dos columnas: X local (metros) y Norte (metros).

Las transformaciones se basan en cdigo generosamente proporcionado por I. Scollar.

225
mapas de Google

Toma dos columnas de latitudes y longitudes en grados decimales (WGS84) y muestra una ventana de Google Maps con las

coordenadas dadas ya sea como: Los puntos con colores y smbolos tomados de la hoja de clculo Pasado (colores no sern exactos),

los polgonos rellenos, o mltiples lneas de segmento. Para polgonos y lneas, el color se toma del color de fila del primer punto. Utilizar

una columna de grupo adicional para especificar varios polgonos o lneas.

Este mdulo requiere conexin a Internet.

226
men de la estratigrafa

Asociaciones unitarias

Unitaria anlisis Asociaciones (Guex 1991) es un mtodo para la correlacin bioestratigrfica (ver Angiolini y Bucher 1999 para una aplicacin
tpica). La entrada de datos se compone de una matriz de presencia / ausencia con muestras en filas y taxones en columnas. Las muestras que
pertenecen a la misma seccin (localidad) deben ser asignados al mismo grupo, y ordenaron estratigrficamente dentro de cada seccin de tal
manera que la muestra ms baja entra en la fila ms baja.

Descripcin general del mtodo

El mtodo de Asociaciones Unitaria es lgico, sino ms bien complicado, que consiste en un nmero de pasos. Para ms detalles, vase Guex
(1991). La puesta en prctica en el pasado incluye la mayora de las caractersticas que se encuentran en el programa original, llamados
BioGraph (Savary y Guex 1999), y gracias a una fructfera cooperacin con Jean Guex tambin incluye una serie de opciones y mejoras
adicionales.

La idea bsica es la de generar una serie de zonas de encaje (similar a 'zonas OPPEL') que son ptimas en el sentido de que dan
resolucin estratigrfica mxima con un mnimo de contradicciones superpositional. Un ejemplo de tal contradiccin sera una seccin que
contiene una especie A por encima de una especie B, mientras que encaje 1 (que contiene las especies a) se colocan por debajo de
ensamblaje 2 (que contiene la especie B). PASADO lleva a cabo los siguientes pasos:

227
1. horizontes mximos residuales

El mtodo hace la suposicin de gama-a travs, lo que significa que se consideran taxones haber estado presente en todos los niveles entre la
primera y ltima aparicin en cualquier seccin. A continuacin, las muestras con un conjunto de taxones que est contenido en otra muestra
se descartan. Las muestras restantes se denominan
horizontes mximos residuales. La idea detrs de este tirar de los datos es que los taxones ausente en las muestras descartadas puede
simplemente no han sido encontrados a pesar de que existan originalmente. Las ausencias por lo tanto no son tan informativo como
presencias.

2. Superposicin y co-ocurrencia de taxones

A continuacin, todos los pares (A, B) de taxones son inspeccionados por sus relaciones superpositional: A continuacin B, B a continuacin

A, A junto con B, o desconocido. Si A se produce por debajo B en una localidad y B a continuacin una de otra, se consideran a ser
co-produciendo a pesar de que en realidad nunca se han encontrado juntos.

Las superposiciones y co-ocurrencias de los taxones se pueden ver en el grfico bioestratigrfica. En este grfico, taxones se codifican como
nmeros. Co-ocurrencias entre pares de taxones se muestran como lneas azules slidos. Superposiciones se muestran como lneas rojas
discontinuas, con guiones largos desde el taxn anteriormente se producen y guiones cortos desde el taxn debajo de origen.

Algunos taxones se puede producir en las llamadas prohibidos sub-grficos, que indican las inconsistencias en sus relaciones superpositional. Dos de los

varios tipos de tales sub-grficos pueden representarse grficamente en el pasado: do norte


ciclos, que son ciclos superpositional (A-> B-> C-> A), y S 3 circuitos, que son inconsistencias del tipo 'A co-produciendo con B, C por encima
de A, y C por debajo de B'. Las interpretaciones de tales sub-grficos prohibidos son sugeridos por Guex (1991).

228
3. mxima camarillas

mxima camarillas son grupos de taxones concurrentes no contenidas en cualquier grupo mayor de taxones concurrentes. La mxima
camarillas son candidatos para el estado de las asociaciones unitarias, pero sern tratados ms adelante. En el pasado, las camarillas
mxima reciben un nmero y tambin se nombran despus de un horizonte mxima en el conjunto de datos original que es idntico a, o
contenida en (marcado con asterisco), la camarilla mxima.

4. Superposicin mximo de camarillas

Las relaciones entre superpositional mxima camarillas se deciden mediante la inspeccin de las relaciones entre su superpositional taxones
constituyente, tal como se calcula en el paso 2. Las contradicciones (en algunos taxones camarilla A continuacin se producen en algunos taxones
camarilla B, y viceversa) se resuelven por un 'voto de la mayora '. Las contradicciones entre camarillas se pueden ver en el pasado.

Las superposiciones y co-ocurrencias de camarillas se pueden ver en el grfico camarilla mxima. En este grfico, camarillas se codifican como
nmeros. Co-ocurrencias entre pares de camarillas se muestran como lneas azules slidos. Superposiciones se muestran como lneas rojas
discontinuas, con guiones largos de la camarilla arriba de origen y rayas cortas a partir de la camarilla debajo de origen. Tambin, ciclos entre
camarillas mxima (vase ms adelante) pueden ser vistos como lneas verdes.

5. Resolucin de ciclos

A veces ser el caso de que las camarillas mxima ahora estn ordenados en ciclos: A est por debajo de B, que est por debajo de C, que est por

debajo de A de nuevo. Esto es claramente contradictoria. El 'eslabn ms dbil' (relaciones de superposicin con el apoyo de taxones menor cantidad)

en dichos ciclos se destruye.

6. Reduccin de camino nico

En esta etapa, debemos tener idealmente un nico camino (cadena) de las relaciones superpositional entre camarillas mxima, de abajo a
arriba. Esto no es sin embargo a menudo el caso, por ejemplo, si A y B estn por debajo de C, que est por debajo de D, o si han aislado
caminos sin ningn tipo de relaciones (A continuacin B y C por debajo de D). Para producir un nico camino, es necesario fusionar camarillas
de acuerdo a normas especiales.

7. Post-procesamiento mximo de camarillas

Finalmente, un nmero de manipulaciones menores se llevan a cabo a 'polaco' el resultado: Generacin de la propiedad de los 'unos
consecutivos, reinsercin de co-ocurrencias residuales virtuales y superposiciones y compactacin para eliminar cualquier camarillas no
mximos generados. Para ms detalles sobre estos procedimientos, consulte Guex (1991). Por fin, ahora tenemos las Asociaciones unitario,
que puede ser visto en el pasado.

229
Las asociaciones unitarios han asociado con ellos un ndice de similitud de una UA a la siguiente, llamado D:

re i = | UA yo- UA i-1 | / | UA i | + | UA i-1- UA i | / | UA i-1 |

8. Correlacin utilizando las asociaciones de Unitarios

Las muestras originales estn correlacionadas utilizando las asociaciones de unitarios. Una muestra puede contener taxones que sita de
forma nica en una asociacin unitaria, o puede carecer de los taxones clave que podran diferenciar entre dos o ms asociaciones unitarios,
en cuyo caso se puede dar slo una gama. Estas correlaciones se pueden ver en el pasado.

matriz 9. Reproducibilidad

Algunas asociaciones unitarias pueden ser identificados en slo una o unas pocas secciones, en cuyo caso se puede considerar fusionar asociaciones

unitarias para mejorar la reproducibilidad geogrfica (vase ms adelante). La matriz reproducibilidad debe ser inspeccionada para identificar tales

asociaciones unitarios. A UA que se identifica de forma nica en una seccin se muestra como un cuadrado negro, mientras que los rangos de UAs

(como se da en la lista de correlacin) se muestran en gris.

10. grfico Reproducibilidad y sugiri fusiones UA (biozonacin)

El grfico reproducibilidad (Gk' en Guex 1991) muestra las superposiciones de asociaciones unitarias que realmente se observan en las
secciones. PASADO reducir internamente esta grfica para una trayectoria nica mxima (Guex 1991, seccin 5.6.3), y en el proceso de
hacerlo, se puede fusionar algunos UA. Estas son las fusiones

230
se muestra como lneas rojas en el grfico de la reproducibilidad. La secuencia de las AU individuales y combinadas puede ser visto como un

biozonacin sugerido.

funcionalidad especial

La implementacin del mtodo Asociaciones unitarios en el pasado incluye un nmero de opciones y funciones que an no han sido descritos
en la literatura. Para preguntas acerca de estos, por favor, pngase en contacto con nosotros.

referencias

Angiolini, L. y H. Bucher. 1999. Taxonoma y biocronologa cuantitativa de braquipodos Guadalupian de la


Formacin Khuff, Sureste de Omn. Geobios 32: 665-699.

Guex, J. 1991. biocronolgico correlaciones. Springer Verlag.

Savary, J. & J. Guex. 1999. Escalas discreta biocronolgico y Asociaciones Unitarios: Descripcin del programa de ordenador
BioGraph. Meomoires de Geologa (Lausanne) 34.

231
Clasificacin-Scaling

Clasificacin-Escala (Agterberg y Gradstein 1999) es un mtodo para bioestratigrafa cuantitativo basado en


eventos en una serie de pozos o secciones. La entrada de datos se compone de pozos en filas con un pocillo por fila, y los acontecimientos (por
ejemplo, FAD y / o los LADs) en columnas. Los valores de la matriz son profundidades de cada evento en cada pocillo, aumentando hacia arriba (es

posible que desee utilizar los valores negativos para lograr esto). Las ausencias se codifican como cero. Si slo el orden de los eventos se conoce,

esto puede ser codificada como el aumento de nmeros enteros (filas, con posibles lazos para eventos concurrentes) dentro de cada pocillo.

La implementacin de la clasificacin de escalado en el pasado no es exhaustiva, y los usuarios avanzados se refiri a la


RASC y programas de CASC Agterberg y Gradstein.

Descripcin general del mtodo

El mtodo de la Clasificacin-escalamiento contina en dos pasos:

1. La ordenacin

El primer paso de Clasificacin-Scaling es producir un nico pedido, integral estratigrfica de eventos, incluso si los datos contienen
contradicciones (evento A sobre la B en un pozo, pero B sobre A en otro), o ciclos ms largos (A ms de B durante C sobre A). Esto se hace por
'voto de la mayora', contando el nmero de veces que cada evento se produce por encima, por debajo o junto con todos los dems.
Tcnicamente, esto se logra mediante Preclasificacin seguido de la modificacin Mtodo Hay (Agterberg y Gradstein 1999).

2. Escala

El anlisis bioestratigrfica puede terminar con ranking, pero una visin adicional puede ser obtenida mediante la estimacin de
distancias estratigrficas entre los eventos consecutivos. Esto se hace contando el nmero de relaciones superpositional observados (A
encima o por debajo B) entre cada par (A, B) de los eventos consecutivos. Un bajo nmero de contradicciones implica larga distancia.

Algunas distancias calculadas pueden llegar a ser negativo, lo que indica que la ordenacin propuesta por el paso de clasificacin no era
ptima. Si esto sucede, los eventos son reordenadas y las distancias recalculados con el fin de garantizar que slo positivos distancias
entre eventos.

RASC en el pasado

parmetros

Bien umbral: El nmero mnimo de pocillos en los que debe ocurrir un evento con el fin de ser incluido en el anlisis

232
Par umbral: El nmero mnimo de veces a la relacin entre los eventos A y B debe ser observado para que el par (A,
B) que debe incluirse en la etapa de clasificacin
umbral de escalamiento: umbral de par para la etapa de escalamiento

Tolerancia: Se utiliza en la etapa de clasificacin (ver Agterberg y Gradstein)

Clasificacin

Se da el orden de los eventos despus de la etapa de clasificacin, con el primer evento en la parte inferior de la lista. La columna "Rango"
indica la incertidumbre en la posicin.

Escalada

Se da el orden de los eventos despus de la etapa de escalamiento, con el primer evento en la parte inferior de la lista. Para una explicacin de
todas las columnas, consulte Agterberg y Gradstein (1999).

la distribucin de sucesos

Un grfico que muestra el nmero de eventos en cada pocillo, con los pozos orden segn el nmero de eventos.

diagramas de dispersin

Para cada pocillo, la profundidad de cada evento en el pozo se representa frente a la secuencia ptima (despus de escalar). Idealmente, los
eventos deben trazar en una secuencia ascendente.

dendrograma

Parcela de las distancias entre los acontecimientos en la secuencia de escalado, incluyendo un dendrograma que puede ayudar en la zonificacin.

Referencia

Agterberg, FP y FM Gradstein. 1999. El mtodo para RASC Clasificacin y descamacin de bioestratigrficas Eventos. En: Actas del
Congreso 75o cumpleaos CW Drooger, Utrecht, noviembre de 1997. Tierra Science Review 46 (1-4): 1-25.

233
optimizacin con restricciones (CONOP)

Tabla de profundidades / niveles, con pozos / secciones en filas y pares de eventos en columnas: DCP en las columnas impares y muchachos en

columnas pares. Missing eventos codificados con ceros.

PASADO incluye una versin simple de optimizacin con restricciones (Kemple et al. 1989). Tanto FAD y LAD de cada taxn deben
especificarse en columnas alternas. Uso de llamada recocido simulado, el programa busca una secuencia global (compuesto) de eventos
que implica una cantidad total mnima de extensin del rango (penalizacin) en los pocillos / secciones individuales. Los parmetros para el
procedimiento de optimizacin incluyen una temperatura inicial de recocido, el nmero de pasos de refrigeracin, la relacin de refrigeracin
(porcentaje inferior a 100), y el nmero de ensayos por paso. Para la explicacin y recomendaciones, consulte Kemple et al. (1989).

ventanas de salida incluyen la historia de optimizacin con la temperatura y la pena como funcin de la etapa, la solucin de material
compuesto global y los rangos implcitas en cada seccin individual de refrigeracin.

La implementacin de CONOP en el pasado se basa en un ncleo optimizacin FORTRAN proporcionada por Sadler y Kemple.

Referencia

Kemple, WG, PM Sadler & DJ Strauss. 1989. Un prototipo de solucin de optimizacin restringida al problema correlacin de
tiempo. En Agterberg, FP & GF Bonham-Carter (eds), aplicaciones estadsticas en las Ciencias de la Tierra. Geolgico de Canad
Papel 89-9: 417-425.

234
intervalos de confianza del rango

Estimacin de intervalos de confianza para las apariencias primeros o ltimos o gama estratigrfica total de, por un taxn.

Suponiendo un (Poisson) distribucin aleatoria de horizontes fosilferos, y dado el dato primera ocurrencia (nivel), ltimo dato
ocurrencia, y el nmero total de los horizontes donde se encuentra el taxn, podemos calcular intervalos de confianza para la gama
estratigrfica de un taxn (Strauss y Sadler 1989, Marshall 1990).

no se necesitan datos en la hoja de clculo. El programa le pedir el nmero de horizontes donde se encuentra el taxn, y los niveles o
las fechas para las primeras y ltimas apariciones. Si es necesario, utilice los valores negativos para asegurar que el ltimo dato
apariencia tiene un valor numrico ms alto que el primer dato apariencia. 80%, 95% y 99% intervalos de confianza se calculan para el
FAD considerado aisladamente, la LAD considerado aisladamente, y el rango total.

El valor es la longitud del intervalo de confianza dividida por la longitud del intervalo observado.

Para el caso de punto final individual:

1
MARIDO
1 do 1 1 1,

dnde do 1 es el nivel de confianza y MARIDO el nmero de horizontes fosilferos.

Para el caso de punto final conjunta (rango total), se encuentra por solucin iterativa de la ecuacin

MARIDO
1 MARIDO
1
do 2 2 11 1 2 .

La asuncin de distribucin aleatoria, por supuesto, no se mantendr en muchas situaciones reales.

referencias

Marshall, CR 1990. Los intervalos de confianza en los rangos estratigrficos. paleobiologa 16: 1-10.

Strauss, D. & PM Sadler. 1989. intervalos de confianza clsicos y estimaciones de probabilidad bayesiana para extremos de los rangos de taxones
locales. Geologa matemtica 21: 411-427.

235
intervalos de confianza del rango de distribucin libre

La estimacin de intervalos de confianza para las primeras o ltimas apariciones. Asume que no hay correlacin entre la posicin estratigrfica y

tamao de la separacin. Seccin deben tomar muestras de forma continua. Espera una columna por taxn, con niveles o fechas de todos los

horizontes donde se encuentra el taxn. Este mtodo (Marshall 1994) no asume la distribucin aleatoria de los horizontes fosilferos. Se requiere

que se dan los niveles o las fechas de todos los horizontes que contienen el taxn. El programa da salida a lmites superior e inferior de las

longitudes de los intervalos de confianza, utilizando una probabilidad de confianza del 95 por ciento, para niveles de confianza de 50, 80 y 95 por

ciento. Valores que no se pueden calcular estn marcados con un asterisco (ver Marshall 1994).

Referencia

Marshall, CR 1994. Los intervalos de confianza en los rangos estratigrficas: la relajacin parcial de la asuncin de horizontes fsiles

distribuidos al azar. paleobiologa 20: 459-469.

236
scripting

Pasado incluye un lenguaje de script bastante rica, que le permite programar sus propios mdulos de aprovechamiento de la interfaz de
usuario pasado, paquete de grficos y rutinas matemticas y estadsticas. El guionista ya es completamente funcional, pero se ampliar
sustancialmente en futuras versiones.

La estructura del lenguaje

Los guiones se escriben en la sintaxis tipo Pascal. Los elementos fundamentales del lenguaje son:

comenzar a finales .. constructor

procedimiento y funcin declaraciones


si .. entonces .. otra cosa constructor

para .. .. a hacer .. paso constructor


mientras hace constructor
repetir hasta constructor
tratar .. excepto y tratar .. finalmente bloques

caso declaraciones

formacin constructores (x: = [1, 2, 3];)

^, *, /, Y, +, -, o, <>,> =, <=, =,>, <, div, mod, xor, SHL, SHR operadores de acceso a propiedades
de objetos y mtodos ( ObjectName.SubObject.Property)

estructura de la escritura

Un guin est hecho de dos grandes bloques: a) de procedimiento y de funcin declaraciones y b) bloque principal. Ambos son opcionales, pero al

menos uno debe estar presente. No hay ninguna necesidad de que el bloque principal a estar dentro begin..end. Podra ser una sola instruccin. Algunos

ejemplos:

GUIN 1:

procedimiento Hacer algo;


empezar
CallSomethingElse;
fin ;

empezar
Hacer algo;
fin ;

GUIN 2:

empezar
CallSomethingElse;
fin ;

SCRIPT 3:

funcin MyFunction;
empezar

237
Resultado: = 'De acuerdo!' ;
fin ;

SCRIPT 4:

CallSomethingElse;

Las declaraciones deben ser terminados por el ";" personaje. Begin..end bloques se utilizan para agrupar instrucciones.

identificadores

nombres de los identificadores de secuencia de comandos (nombres de variables, funciones y nombres de procedimientos, etc.) deben comenzar con un

carcter (a..z o A..Z), o '_', y puede ser seguido por caracteres alfanumricos o el '_' carbonizarse. No pueden contener otros caracteres o espacios.

identificadores vlidos:

NombreVar
_Some V1A2

_____Algunos____

identificadores no vlidos:

2 var
Mi Nombre Algunos -ms
Este, no es, vlido

asignar declaraciones

Asignar declaraciones (asignacin de un valor o resultado de la expresin a una variable o propiedad objeto) se construyen utilizando ": =". Ejemplos:

MiVar: = 2 ;
Button.Caption: = 'Esta ' + 'Est bien'. ;

Las cadenas de caracteres

Cuerdas (secuencia de caracteres) se declaran utilizando ( ') caracteres comilla simple. . Comillas ( ") no se utilizan tambin puede utilizar #nn
para declarar un personaje dentro de una cadena No hay necesidad de usar el operador '+' para aadir un carcter en una cadena Algunos
ejemplos..:

A: = 'Este es un texto' ; Str: = 'Texto' + 'Concat' ; B: = 'Cadena con CR y LF carbn al final' # 13


# 10 ; C: = 'Cadena con' # 33 # 34 'caracteres en el medio' ;

238
comentarios

Los comentarios estn definidas por caracteres // o (* *) o {} bloques. Con la // char, el comentario terminar al final de la lnea.

// Esto es un comentario antes de ShowMessage


Mostrar mensaje( 'De acuerdo' );
(* Este es otro comentario *)
Mostrar mensaje( 'Ms bien!' );
{Y esto es un comentario con dos lneas}

Mostrar mensaje( 'Fin de okays' );

Variables

No hay necesidad de declarar los tipos de variables. Por lo tanto, se declara una variable simplemente usando la directiva var y su nombre.
Adems, es opcional para declarar variables en absoluto. Variables y sus tipos se declaran implcitamente al primer uso. Ejemplos:

GUIN 1:

procedimiento msg;
var S;
empezar
S: = 'Hola Mundo!' ;
ShowMessage (S);
fin ;

GUIN 2:

var UN;
empezar
A: = 0 ; A: = A
+1;
fin ;

SCRIPT 3:

var S: cuerda ;
empezar
S: = 'Hola Mundo!' ;
ShowMessage (S);
fin ;

var declaraciones no son estrictamente necesarias en cualquiera de las secuencias de comandos anteriores.

Indexacin

239
Cadenas, matrices y propiedades de la matriz pueden ser indexados usando caracteres "[" y "]". Por ejemplo, si Str es una variable de
cadena, la expresin Str [3] devuelve el tercer carcter en la cadena denotada por Str, mientras Str [I + 1] devuelve el carcter
inmediatamente despus de la indexada por I. Ms ejemplos:

MyChar: = MyStr [ 2 ]; MyStr [ 1 ]: = 'UN' ; MiMatriz [ 1 , 2 ]:


= 1530 ; Lines.Strings [ 2 ]: = 'Algn texto' ;

Las matrices

Para construir una matriz, el uso "[" y "]" caracteres. Usted puede construir una matriz multi-ndice, constructores de matriz de anidamiento. A

continuacin, puede acceder a las matrices mediante ndices. Una variable es una matriz si se le asign usando un constructor matriz o si se cre

utilizando los procedimientos de la matriz o vector. Algunos ejemplos:

NewArray: = [ 2 , 4 , 6 , 8 ]; Num: = newArray [ 1 ]; // Num recibe "4"

Multiarray: = [[ 'verde' , 'rojo' , 'azul' ], [ 'manzana' , 'naranja' , 'limn' ]]; Str: = multiarray [ 0 , 2 ]; // Str recibe 'azul'

multiarray [ 1 , 1 ]: = 'Nueva naranja' ; V: = vector (100);


A: = array (100,100);

Arrays definidos utilizando los constructores array puede contener elementos de cualquier tipo, pero las matrices definidas por los procedimientos de

vectores y matrices son de tipo doble.

Arrays construidos utilizando la matriz constructores estn indexados de 0. Adems, matrices definidos usando los procedimientos de vectores
y matrices estn indexados de 0, pero el 0 elemento a menudo no se utiliza y estas matrices contienen n + 1 elementos, indexados de 0 a n.

Si los estados

Hay dos formas de sentencia if: si ... entonces y si ... entonces ... otra cosa. Si la expresin es verdadera, se ejecuta la instruccin (o
bloque). Si hay una parte ms y la expresin es falsa, se ejecuta la instruccin (o bloque), despus de lo dems. Ejemplos:

Si J <> 0 entonces Resultado: = I / J;


Si J = 0 entonces Salida ms Resultado: = I / J;
Si J <> 0 luego
comenzar
Resultado: = I / J; Incluido: =
count + 1 ;
end else

Hecho: = true;

while

Una declaracin mientras que se utiliza para repetir una instruccin o un bloque, mientras que una condicin de control (expresin) es evaluada como

verdadera. La condicin de control se evala antes de la declaracin. Por lo tanto, si la condicin es falsa de control a primera iteracin, la secuencia

de instrucciones nunca se ejecuta. La sentencia while

240
ejecuta su declaracin constituyente (o bloque) varias veces, poniendo a prueba la expresin antes de cada iteracin. Mientras
expresin devuelve verdadero, la ejecucin contina. Ejemplos:

mientras Los datos [I] <> X hacer I: = I + 1 ;

mientras I> 0 do begin

Si Impar (I) entonces Z: = Z * X; I: I = div 2 ; X:


= Sqr (X);

fin ;

mientras no EF (InputFile) do begin

Readln (InputFile, lnea); Proceso (Lnea);

fin ;

declaraciones de repeticin

La sintaxis de una instruccin de repeticin est repetir sentencia1; ...; statementn; hasta que la expresin donde la expresin devuelve un valor
booleano. La instruccin repeat ejecuta su secuencia de instrucciones constituyentes continuamente, pruebas de la expresin despus de cada
iteracin. Cuando la expresin devuelve True, la declaracin de repeticin termina. La secuencia es siempre ejecutado al menos una vez porque
la expresin no se evala hasta despus de la primera iteracin. Ejemplos:

repetir
K: = I mod J; I: = J; J: =
K;

hasta J = 0 ;

repetir
Escribir( 'Introduzca un valor (0..9):' ); Readln (I);

hasta ( I> = 0 ) y ( I <= 9 );

para los estados

Para los estados tienen la siguiente sintaxis: para el contador: = initialValue a finalValue hacer declaracin

El Para los conjuntos de declaracin en contra de initialValue, repite la ejecucin de la instruccin (o bloque) e incrementa el valor del
contador hasta que el contador alcanza finalValue. Ejemplos:

GUIN 1:

para c: = 1 a 10 hacer
a: = a + c;

GUIN 2:

para i: = a a segundo do
begin

241
j: = i ^ 2 ; suma: =
suma + j;
fin ;

declaraciones de caso

declaraciones de casos tienen la siguiente sintaxis:

caso selectorExpression de
caseexpr1: sentencia1;
...
caseexprn: statementn; ms

ElseStatement; fin

Si selectorExpression coincide con el resultado de una de las expresiones caseexprn, se ejecuta la sentencia respectiva (o bloque).
De lo contrario, se ElseStatement executed.The parte else de la sentencia case es opcional. Una declaracin de la caja no tiene que
usar slo valores ordinales. Se pueden utilizar expresiones de cualquier tipo, tanto en la expresin del selector y la expresin caso.
Ejemplo:

caso mayscula (fruta) de


'Lima' : Mostrar mensaje( 'verde' );
'naranja' : Mostrar mensaje( 'naranja' );
'manzana' : Mostrar mensaje( 'rojo' );
ms
Mostrar mensaje( 'negro' );
fin ;

la funcin y el procedimiento de declaracin

Declaracin de funciones y procedimientos son similares a Pascal, con la diferencia de que no especifica los tipos de variables. Para devolver
los valores de funcin, utilice el declarado implcitamente resultado variable. Parmetros por referencia tambin se pueden utilizar, con la
restriccin mencionada: hay necesidad de especificar los tipos de variables. Algunos ejemplos:

procedimiento HelloWord;
empezar
Mostrar mensaje( 'Hola Mundo!' );
fin ;

procedimiento UpcaseMessage (Msg);


empezar
ShowMessage (maysculas (Msg));
fin ;

funcin TodayAsString;
empezar
Resultado: = DateToStr (Fecha);
fin ;

funcin Max (A, B);


empezar

242
Si A> B entonces
Resultado: = A
ms
Resultado: = B;
fin ;

procedimiento (SwapValues var A, B);


var Temperatura;
empezar
Temp: = A; A: =
B; B: = temp;

fin ;

La ventana de resultados

Cuando se ejecuta una secuencia de comandos, se abrir automticamente una ventana de salida. Contiene tres fichas: texto, grficos y tablas.

El texto de las pestaas

La pestaa de texto contiene una ventana a la que la secuencia de comandos puede escribir la salida. El texto se puede copiar y pegar en otros

programas por parte del usuario. Los siguientes procedimientos estn disponibles:

Borrar texto; Limpia la ventana de texto


textout (s); Escribe una lnea de la ventana de texto. Maneja numrico, cadena, vectores y tipos de matriz.

La pestaa grfico

Un lienzo grfico de tamao variable con la funcionalidad Pasado habitual, tal como una ventana de preferencias de grfico con la exportacin a vectorial

(SVG o PDF) o en formato de mapa de bits. La ventana se escala automticamente a su contenido, por lo que no es necesario tener en cuenta la escala

de coordenadas. Para una mayor eficacia, no aparecern los grficos hasta que el procedimiento se llama redibujado.

Los colores deben ser dados como una de las siguientes constantes: negro, rojo, azul, verde, prpura, amarillo, gris, marrn.

redibujar Volver a dibujar la ventana grfica con rangos de ejes automticos


setaxes (x1, x2, y1, y2) Volver a dibujar el grfico con los rangos de ejes dados

cleargraphic Limpia la ventana grfica


savegraphic (filename) Dependiendo de la extensin de archivo, se guardar el grfico en uno de los siguientes
formatos: SVG, PDF, JPG, TIF, GIF, PNG, BMP
drawpoints (x, y, color) Llama un punto (si x e y son nmeros individuales) o varios (si x e y son vectores). El
color es un solo nmero entero (ver arriba).
drawsymbols (x, y, color, smbolo) Llama un smbolo (si x e y son nmeros individuales) o varios (si x e y son vectores). El
color y el smbolo son nmeros enteros individuales, ver '' spreadsheet_symbols para el
smbolo de codificacin.
drawLine (x1, y1, x2, y2, color) Una lnea a partir de (x1, y1) a (x2, y2)

243
drawpolyline (x, y, color) Una polilnea con listas de coordenadas x e y en vectores xey
drawRectangle (x1, y1, x2, y2, color) Un rectngulo con las esquinas dadas
drawEllipse (x, y, mayor, menor, ngulo, color)
Una elipse con centro (x, y), dado ejes mayor y menor y con el eje mayor
en el ngulo dado (radianes) para el eje x.
DrawText (x, y, string) Llama la texto en la posicin (x, y) - puede reposicionar para reducir la superposicin

drawmatrix (A, interpolar) Seala a la matriz A. Conjunto interpolar a falso o verdadero para seleccionar el modo de

dibujo. Hace un redibujado automtico.

drawhistogram (V, nbins, color, kde) Un histograma de vector V, con el nmero dado de contenedores. Si kde = true, una

estimacin de la densidad del ncleo tambin se dibuja.

barras de traccin (V, color) Un grfico de barras de vector V.

drawboxplot (V, x, los valores atpicos) Un diagrama de caja de vector V en la posicin x dada. Los valores atpicos es verdadera o

falsa.

drawconvexhull (Vx, Vy, color) El casco convexo de los puntos en los vectores de Vx y Vy.
drawrose (V, n, equalarea, kde) Una parcela rosa de ngulos en V (grados), con n bins. Equalarea y kde (estimacin
de densidad kernel) son verdaderas o falsas.

La tabla tab

Una tabla (hoja de clculo) ventana con la funcin de copiar y pegar.

tableSize (filas, columnas: enteros) Establecer el nmero de filas y columnas en la tabla

tableout (fila, col, valor) Escribir el valor de una celda en particular en la tabla, la indexacin a partir de 0.

Acceso a la hoja de clculo principal Pasado

spreadsheet_array Devuelve una matriz que contiene el rea seleccionada en la hoja de clculo pasado.
columnas de grupo no estn incluidos

spreadsheet_column (n: nmero entero) Devuelve un vector con los nmeros en la columna norte en la hoja de clculo pasado.

spreadsheet_groups (n: nmero entero) Devuelve un vector con nmeros de grupo correspondientes a las filas de
spreadsheetarray. Para n = 1, se devuelve la primera columna de grupo, para n = 2 la
columna de la segunda grupo (si existe), etc.

spreadsheet_rowlabels Devuelve un vector de cadena con las etiquetas de las filas de la regin seleccionada.

spreadsheet_columnlabels Devuelve un vector de cadena con las etiquetas de columna en el rea seleccionada.

spreadsheet_symbols Devuelve un vector con los nmeros (0-15) la identificacin de los smbolos

244
correspondiente a las filas de spreadsheetarray. 0 = punto, 1 = +, 2 = cuadrado, 3 =
X, 4 = tringulo, 5 = O, 6 = diamante, 7 = -, 8 = l, 9 = fillsquare, 10 = *, 11 = oval, 12 =
filltriangle 13 = invtriangle, 14 = fillinvtriangle, 15 = filldiamond

spreadsheet_set (fila, col, s) Establece el contenido de la celda en (fila, columna) en la hoja de clculo pasado a s

(nmero o cadena). Indexing comienza desde 0 (clulas de la etiqueta).

operaciones de matriz y vector

Array (m, n: nmero entero) Asigna y devuelve una matriz de flotador (doble) con metro y filas norte columnas, la indexacin a partir de las

1.
Vector (n: nmero entero) Asigna y devuelve un vector (matriz unidimensional) con norte elementos, indexacin a partir de
1
Columna (A, n) Devuelve la columna norte en la matriz A, como un vector

Row (A, m) Volver fila norte en la matriz A, como un vector

Ncols (A) Devuelve el nmero de columnas de la matriz A


NRows (A) Devuelve el nmero de filas de la matriz A
Inv (A) Inversa de la matriz cuadrada A

Arrmult (A, B) Devuelve un array de multiplicacin A * B

La media (V) Media de vector V


Varianza (V) Varianza de vector V
Skew (V) Skew de vector V
Kurtosis (V) Curtosis de vector V
Svd (A) Descomposicin en valores singulares de A, V volver aumentada por una columna adicional que
contiene D.

Algunas funciones matemticas comunes estn disponibles para las matrices y vectores, para la eficiencia. La funcin se aplica
a cada elemento de la matriz o vector, devuelve una matriz o vector.

ArrAbs (A) Valor absoluto


ArrCos (A) Coseno (radianes)
ArrExp (A) mi x
ArrLn (A) logaritmo natural (base mi)
ArrSin (A) Sine (radianes)
ArrSqrt (A) Raz cuadrada

ArrTan (A) Tangente (radianes)

funciones matemticas escalares

Abs (x) Valor absoluto


Arctan (x) tangente inversa (radianes)
Arctan2 (y, x) tangente inversa de y / x extendido para corregir cuadrante.
Cos (x) Coseno (radianes)

245
Exp (x) mi x
Frac (x) parte fraccionaria x
Fresnel (x) Devuelve una 2-vector con las integrales S y C de Fresnel a x.
Ln (x) logaritmo natural (base mi)
Normal (m, s) nmero aleatoria distribuida normalmente, media = m, DESVEST = s. Gamma (k)
Gamma distribuido al azar nmero, la forma = k, escala = 1.
InvNorm (x) Inverso de la distribucin normal acumulativa, media = 0, DESVEST = 1, 0 <x <1
Invchi2 (x, df) Inverso de la distribucin chi-cuadrado acumulativo con df grados de libertad
Odd (x) verdadero si x es impar

Aleatorio de nmeros aleatorios, la distribucin uniforme, 0 <= x < 1

Round (x) Rondas al entero ms cercano


Sin (x) Sine (radianes)
Sqr (x) Cuadrado ( x * x)

Sqrt (x) Raz cuadrada

Tan (x) Tangente (radianes)


Trunc (x) Redondeo a la baja

Puedo presentar E / S

funcin Adjuntar( var F: File): Integer;

Prepara un archivo existente para aadir texto a su fin. F es una variable de archivo de texto y debe estar asociado con un archivo
externo, utilizando AssignFile. Si no existe el archivo externo, se produce un error. Si F ya est abierta, se cierra, se vuelve a abrir. La posicin
actual del fichero se encuentra al final del archivo.

funcin AssignFile ( var F: Archivo; FileName: String): Integer;

Asocia el nombre de un archivo externo con una variable de archivo. Despus de llamar a AssignFile, M se asocia con el archivo externo

hasta que F est cerrada. Todas las operaciones posteriores en la variable de fichero F operan en el archivo externo llamado por el nombre de archivo.

procedimiento ChDir ( S: string);


Cambia el directorio actual a la ruta especificada por S.

procedimiento Cerrar el archivo( var F: File);

Termina la asociacin entre una variable de archivo y un archivo de disco externa. F es una variable de fichero abierto con Reset, regrabar
o Anexar. El archivo externo asociado con F se encuentre totalmente actualizado y se cierra, liberando el identificador de archivo para su reutilizacin.

funcin eof ( var F: File): Boolean;


Comprueba si la posicin del fichero se encuentra al final de un archivo.

funcin FilePos ( var F: File): Integer;

246
El uso en un archivo abierto para determinar la posicin actual. Si la posicin actual se encuentra al principio, FilePos devuelve 0. De
lo contrario, FilePos devuelve el desplazamiento desde el principio del archivo de bytes.

funcin Tamao del archivo( var F: File): Integer;


Devuelve el nmero de registros en un archivo.

procedimiento ReadLn ( var F: Archivo; var S: string);


Lee una lnea de texto y luego salta a la siguiente lnea del archivo.

procedimiento Reiniciar( var F: File);


Abre el archivo externo existente con el nombre asignado a F. Se producir un error si no existe ningn archivo externo
existente del nombre dado o si el archivo no se puede abrir. Si F ya est abierto, se cierra primero y luego volvi a abrir. La posicin
actual del fichero se ajusta al principio del archivo.

procedimiento Volver a escribir( var F: File);

Crea un nuevo archivo externo con el nombre asignado a F. F est asociado con un archivo externo usando AssignFile. Si
un archivo con el mismo nombre ya existe, se elimina y un nuevo archivo vaco se crea en su lugar. Si F ya est abierto, se cierra
primero y luego volver a crear. La posicin actual del fichero se ajusta al principio del archivo vaco.

procedimiento WriteLn ( var F: Archivo; S: string);


Escribe en un archivo de texto y aade un marcador de fin de lnea.

operaciones con cadenas

funcin Chr ( X: Byte): Char;


Devuelve el carcter de un valor ASCII especificado.

funcin CompareStr ( S1, S2: string): Integer;


Compara S1 a S2, con maysculas y minsculas. El valor de retorno es inferior a 0 si S1 es menor que S2, S1 es igual a 0 si S2,
o mayor que 0 si S1 es mayor que S2.

funcin CompareText ( S1, S2: string): Integer;


Compara S1 a S2, sin maysculas y minsculas. El valor de retorno es inferior a 0 si S1 es menor que S2, S1 es igual a 0 si
S2, o mayor que 0 si S1 es mayor que S2.

funcin Dupdo( S: string; ndice: Integer; Incluido: Entero): string;


Devuelve una subcadena de una cadena S. ndice y cuentan son de tipo entero expresiones. Copia Devuelve una subserie o del

subconjunto que contiene un nmero de caracteres o elementos a partir de S [ndice].

247
funcin FloatToStr ( Valor: Doble): string;
do onverts el valor de punto flotante propuesta por Valor la representacin de cadena. La conversin utiliza
formato general nmero con 15 dgitos significativos.

procedimiento Insertar( Fuente: string; var Dest: string; ndice: entero);


Inserta una subcadena en una cadena, desde una posicin especificada. Si ndice es menor que 1, se establece en

1. Si es all del final de Dest, se fija a la longitud de Dest, convirtiendo la operacin en un append.

funcin IntToStr ( Valor: entero): string;


Convierte un entero a una cadena que contiene su representacin decimal.

funcin Longitud( S: string): Integer;


Devuelve el nmero de caracteres de una cadena.

funcin minsculas ( S: String): String;


Devuelve una cadena con el mismo texto que en S, pero con todas las letras convertidos en minsculas.

funcin Pos ( Substr, str: String; Offset: entero): Integer;

Devuelve un ndice de la primera ocurrencia de la subcadena en Call, a partir de la bsqueda en offset. Devuelve cero si no se encuentra

substr o desplazamiento no es vlido.

funcin StrToFloat ( S: string): Doble;

Convierte una cadena a un valor de punto flotante (anterior y posterior espacios en blanco se ignoran).

funcin StrToInt ( S: string): Integer;


Convierte una cadena que representa un nmero entero en un nmero.

funcin StrToIntDef ( S: string; Por defecto: Entero): Integer;

Convierte la cadena S, que representa un nmero entero, en un nmero. Si S no representa un nmero vlido,

StrToIntDef vuelve por defecto.

funcin Recortar( S: String): String;

Recorta espacios iniciales y finales y caracteres de control de una cadena.

funcin TrimRight ( S: String): String;

Adornos espacios finales y caracteres de control de una cadena.

funcin maysculas ( S: String): String;


248
Devuelve una copia de una cadena en maysculas.

Otras funciones

procedimiento Mostrar mensaje( S: string);

Muestra un cuadro de mensaje y espera a que el usuario haga clic en OK.

funcin InputQuery ( Leyenda, Prompt: string; Valor var: String): Boolean;

Muestra un cuadro de dilogo de entrada que permite al usuario introducir un valor. Leyenda es el ttulo del cuadro de dilogo. Preguntar es
el texto que pide al usuario que introduzca entrada. El valor es el valor que aparece en el cuadro de edicin cuando el dilogo aparece por primera vez
y devuelve el valor que el usuario introduce. InputQuery devuelve verdadero si el usuario elige Aceptar, false si el usuario elige Cancelar o presiona
Esc.

procedimiento dormir( ms: nmero entero);

Suspende la ejecucin de la secuencia de comandos para el nmero de milisegundos.

Llamar a funciones DLL (slo Windows)

Pasado permite la importacin y llamar a funciones DLL externas, mediante una declaracin de las rutinas de script, indicando nombre de la biblioteca y,

opcionalmente, la convencin de llamada, adems de la firma de la funcin. bibliotecas externas son cargados por el pasado en la demanda, antes de

que las llamadas de funcin, si no est ya cargado (dinmica o esttica). Para cargar y descargar las bibliotecas de forma explcita, las funciones

LoadLibrary y FreeLibrary de la unidad de Windows pueden ser utilizados.

Sintaxis

funcin functionName (argumentos): resultType; [CallingConvention]; externo 'libName.dll' [nombre


ExternalFunctionName];

Por ejemplo, la declaracin siguiente:

funcin MyFunction (arg: nmero entero): nmero entero; 'CustomLib.dll' externa;

importa una funcin llamada MyFunction de CustomLib.dll. convencin de llamada por defecto, si no se especifica, es el registro. Scripter

tambin permite declarar una convencin de llamada diferente (stdcall, regstrese, Pascal, cdecl o Safecall) y utilizar un nombre diferente

para la funcin DLL, al igual que la siguiente declaracin:

249
funcin MessageBox (hwnd: puntero; texto, subttulo: string; msgtype: nmero entero): nmero entero; stdcall; Nombre
externa 'User32.dll' 'MessageBoxA';

que la funcin de importaciones '' MessageBoxA de User32.dll (biblioteca API de Windows), llamado 'cuadro de mensaje' que se utiliza en la escritura.

Declaracin anterior se puede utilizar para funciones y procedimientos (rutinas sin valor del resultado).

tipos soportados

Pasado soporta los siguientes tipos de datos bsicos sobre los argumentos y el resultado de las funciones externas:

Char nmero

entero booleano

extendido

Cadena puntero

PChar objeto de

clase WideChar

PWideChar

AnsiString

moneda

variante interfaz

WideString

Entero largo

cardenal

LongWord solo

byte Shortint

Palabra Smallint

Doble real

Fecha y hora

descendientes TObject (clase debe registrarse en scripter con defineClass)

Otros tipos (registros, matrices, etc.) no son compatibles todava. Argumentos de tipos anteriores se pueden pasar por referencia, mediante la adicin

de var en la declaracin PARAM de la funcin.

250
Bibliotecas y clases

Formas y componentes

Para la entrada de usuario ms compleja que la que proporciona la funcin InputQuery (ver arriba), usted puede construir sus propias formas

(ventanas) con los siguientes componentes: Etiquetas, ediciones (donde el usuario puede introducir texto y nmeros), botones y casillas de

verificacin.

Formar

Una forma se define con una variable de tipo TForm, y ha creado usando TForm.CreateNew (nil, 0). Algunas propiedades tiles de la
clase TForm son:

Subttulo El texto en la parte superior del formulario

Anchura Anchura en pxeles

Altura Altura en pxeles

El mtodo ShowModal muestra el formulario, volviendo Mrok o mrCancel en funcin de los botones hecho clic en la forma (ver
botn de abajo).

Etiqueta

Una etiqueta, de tipo TLabel, creado con Tlabel.create (parentform) muestra un texto simple. Propiedades de la clase incluyen TLabel

Padre: La forma parental, debe especificarse aqu, adems de en TLabel.create


Texto El texto del subttulo
Position.x x posicin, en pxeles, con relacin a la forma parental
Position.y posicin y, en pxeles
Anchura Anchura en pxeles

Editar

Una caja, de tipo TEdit, creado con TEdit.create (parentform), donde el usuario puede introducir texto o nmeros. Propiedades
de la clase incluyen TEdit

Padre: La forma parental, debe especificarse aqu, adems de en TEdit.create


Texto El texto del subttulo
Position.x x posicin, en pxeles, con relacin a la forma parental
Position.y posicin y, en pxeles
Anchura Anchura en pxeles

Botn

251
Un botn, de tipo TButton, creada con TButton.create (parentform). Propiedades de la clase incluyen TButton

Padre: La forma parental, debe especificarse aqu, adems de en TButton.create


Texto El texto del subttulo
Position.x x posicin, en pxeles, con relacin a la forma parental
Position.y posicin y, en pxeles
Anchura Anchura en pxeles

Altura Altura en pxeles


modalResult Se puede configurar para Mrok o mrCancel. Cuando se hace clic en el botn, este valor es devuelto por el mtodo ShowModal
del formulario.

casilla de verificacin

Una casilla de verificacin, de tipo TCheckBox, creado con TCheckBox.create (parentform). Propiedades de la clase incluyen
TCheckBox

Padre: La forma parental, debe especificarse aqu, adems de en TCheckBox.create


Texto El texto del subttulo
Position.x x posicin, en pxeles, con relacin a la forma parental
Position.y posicin y, en pxeles
Anchura Anchura en pxeles

est chequeado Booleano (Verdadero o Falso). Slo lectura, no se establece en True a partir del cdigo, no va a funcionar

Ejemplo

La siguiente secuencia de comandos muestra un formulario con una etiqueta, un control de edicin y un botn Aceptar. Cuando el usuario hace clic

en el botn, el texto del control de edicin se escribe en la ventana de texto.

var
fm: TForm; lb:
TLabel; ed:
TEdit; bt:
TButton;
empezar
fm: = TForm.CreateNew (nil, 0); fm.Caption:
= '! Una forma nueva'; fm.Width: = 300;
fm.Height: = 150;

lb: = TLabel.Create (fm);


lb.Parent: = fm; lb.Position.X:
= 10; lb.Position.Y: = 10;
lb.Text: = 'Nombre:';

ed: = TEdit.Create (fm);

252
ed.Parent: = fm;
ed.Position.X: = lb.Position.X;
ed.Position.Y: = lb.Position.Y + lb.Height + 10;

bt: = TButton.Create (fm);


bt.Parent: = fm;
bt.Position.X: = ed.Position.X;
bt.Position.Y: = ed.Position.Y + ed.Height + 10; bt.Text: =
'Ok'; bt.Default: = true; bt.ModalResult: = Mrok;

fm.ActiveControl: = ed; // Establece el foco en el control de edicin

Si fm.ShowModal = Mrok continuacin


textout ( 'Hola '+ + ed.Text'!'); fm.Free; fin;

253