Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tutorial Stats (SPN) PDF
Tutorial Stats (SPN) PDF
TUTORIAL STATS
Junho/2002
DATAMINE Latin America Tutorial STATS
Índice
1. Introducción ........................................................................................................................................ 3
2. Resumen del proceso .......................................................................................................................... 4
3. Mensajes de alerta y de error................................................................................................................ 5
4. Notas ................................................................................................................................................. 5
11º Workshop DATAMINE do Brasil & 3º Conferencia Latino Americana de Usuarios DATAMINE
-2-
DATAMINE Latin America Tutorial STATS
1. Introducción
Permite calcular un completo resumen estadístico de los campos numéricos de un archivo. Los
campos a utilizar para los procesos estadísticos puede ser seleccionado en las entradas de
campos *F1, *F2, etc o bien especificando un archivo &FIELDLST que contendrá el listado de
los campos a utilizar. Si el usuario no especifica ningún campo en particular, entonces el
proceso por defecto calculará la estadística para todos los campos numéricos presentes en el
archivo.
El usuario podrá utilizar hasta 5 campos llaves para filtrar la información, pero de no ser
definidos entonces el proceso utilizará todo el conjunto poblacional para realizar la estadística.
Para utilizar la propiedad de los campos llaves el usuario deberá previamente ordenar la
información de acuerdo a esos campos llaves, ya que el proceso básicamente realiza la
siguiente función de selección de muestras, el considera todas aquellas muestras con el mismo
valor del campo llave y las considera para la estadística, hasta que el valor del campo llave
cambia.
Además, en forma opcional este proceso permite ponderar las muestras a utilizar en la
estadística, por un campo de ponderación (*WEIGHT) , un ejemplo muy común es la
ponderación de las muestras de sondajes por su respectivo largo, información almacenada en el
campo "LENGTH".
La varianza y los otros momentos son calculados usando el método de aproximación de las
pequeñas muestras, esto quiere decir que para el cálculo de la varianza por ejemplo se usará el
divisor N-1 en vez del número total de muestras.
La siguiente estadística es calculada para cada variable numérica, a partir de este proceso.
archivo de impresión.
11º Workshop DATAMINE do Brasil & 3º Conferencia Latino Americana de Usuarios DATAMINE
-4-
DATAMINE Latin America Tutorial STATS
4. Notas
Por defecto el proceso calcula la estadística de todos los campos numéricos del archivo de
entrada, incluyendo lo campos implícitos del sistema, tales como las coordenadas del archivo.
Por esta razón, es muy normal que nuestros usuarios utilicen este proceso para determinar las
coordenadas mínimas y máximas donde se mueve la información espacial.
El primer intervalo del histograma ploteado contiene todos los valores mayores al valor
"MINIMUM" especificado, mientras que el último intervalo contiene todos los valores que están
por sobre el valor máximo de la base de datos.
La estadística de los valores logarítmicos está basada en todas las muestras mayores al valor
de traza del sistema.
Ejemplo
!STATS &IN(ASSAYS),&OUT(DHSTATS),*F1(AU),*F2(AG),*F3(CU),
*WEIGHT(LENGTH),@ECHO=1,@PLOT=1
11º Workshop DATAMINE do Brasil & 3º Conferencia Latino Americana de Usuarios DATAMINE
-6-