Está en la página 1de 3

Datos morfolgicos de Parsitos en Eses de Aves de Corral 1. Base de Datos.

http://www.coccidia.icb.usp.br/coccimorph/repository/readme_chicken.txt Nmero de Registros: 3891 Nmero de atributos(caractersticas): 13 (columnas), la columna 14 identifica la clase Nmero de clases: 7
Attribute Information: 1. mean of curvature: 2. standard deviation of curvature: 3. entropy of curvature: 4. major axis (lenght): 5. minor axis (width): 6. symmetry through major axis: 7. symmetry through minor axis: 8. area: 9. entropy of internal structure: 10. second angular moment: 11. contrast: 12. inverse difference moment 13. entropy of co-occurrence matrix 14. classes: Tipo de dato continuous continuous continuous continuous continuous continuous continuous integer continuous continuous continuous continuous continuous 1,2,3,4,5,6,7

Distribution Class Number 1 2 3 4 5 6 7

of Classes Class Name E. acervulina E. maxima E. brunetti E. mitis E. praecox E. tenella E. necatrix

Number of Instances 636 321 418 757 747 608 404 --3891

2. Explicacin del modelo a implementar (Clasificador Bayesiano).


Tenemos que hallar un modelo para cada clase con la siguiente formula ( es decir que tenemos que tener 7 modelos).

gi(x)= -1/2(x- i)T i-1 (x- i) (d/2) ln(2) ln | i |+ln(1/7)


Donde:

i: es el numero de clase(grupo). i=1, 2,3,4,5,6,7 X: vector de dimensin 13 (atributos o caractersticas), es decir:

X = [x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13]
NOTA: El modelo debe calcular para cualquier valor del vector: X = [x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12, x13] reemplazando en las 7 funciones: g1(x), g2(x), g3(x), g7(x); por lo tanto debe ubicarse el nuevo objeto(instancia X) en la clase correspondiente donde tenga el MAYOR valor gi(x).

i: vector de medias o promedios de la clase i (x- i)T : Transpuesta de la matriz de la clase i i: Matriz(13x13) de Covarianza de la clase i i-1: Inversa de la Matriz de la covarianza de la clase i d: numero de atributos( en este caso d=13) ln: logaritmo neperiano. | i |: determinante de la matriz de covarianzas

..

El vector de medias de la clase(grupo) i es: i = [ui1, ui2, ui3, ui4, ui5, ui6, ui7, ui8, ui9, ui10, ui11, ui12, ui13] , donde: ui1 : Media de la carcteristica(atributo 1). ui2 : Media de la carcteristica(atributo 2). . . ui12 : Media de la carcteristica(atributo 12). u i13: Media de la carcteristica(atributo 13).

En el archivo de datos, las medias se calculan de la siguiente forma: C1 X1 C2 X2 . C3 X3 . . . . . . . C13 X13 Clase 1 1 . 1 2 .. 2 etc 7 .. 7

636 registros

u11 u12 u13


. etc . .

u113

321 registros

. etc . .

u21 u22 u23 .. . .


u213 ..

. 404 registros

u 71 u72 u73
Cj: Caracterstica(atributo) j, j=1,2,3,,13

u 713

La Matriz de covarianza (i ) de cada clase (grupo) se calcula de los datos de la Matriz Ai , i=1,2,,7 (la matriz Ai para cada clase se forma de los datos ubicados en el sombreado de color amarillo) Por ejemplo: La matriz A1 es de dimension 636x13. La matriz A2 es de dimension 321x13. . La matriz A7 es de dimension 404x13. Cada Matriz de Covarianza i (para cada clase o grupo) es de dimension 13x13

NOTA: En MatLab (Statistic toolbox), teniendo la matriz, los comandos para hallar son: COV(Ai): Calcula la Matriz de Covarianza de la matriz Ai. INV(Ai): Calcula la inversa de la matriz Ai. DET(Ai): Determinante de la matriz Ai.