Está en la página 1de 9

Revista

Artculo original
Mxico
Revista Alergia Mxico 2015;62:125-133.

Chiharu Murata1
Anlisis discriminante para Ana Beln Ramrez2
Guadalupe Ramrez3
predecir el diagnstico clnico Alonso Cruz3
Jos Luis Morales4
de inmunodeficiencias primarias: Saul Oswaldo Lugo-Reyes2

reporte preliminar Departamento de Metodologa de la Investigacin.


1
2
Unidad de Investigacin en Inmunodeficiencias.
3
Servicio de Inmunologa Clnica.
Instituto Nacional de Pediatra, Secretara de Salud,
RESUMEN Mxico, DF.
4
Departamento de Matemticas, Instituto Tecnolgi-
Antecedentes: las caractersticas clnicas de un paciente con sospecha co Autnomo de Mxico, Distrito Federal.
de inmunodeficiencia primaria orientan el diagnstico diferencial por
medio del reconocimiento de patrones. Las inmunodeficiencias prima-
rias son un grupo heterogneo de ms de 250 enfermedades congnitas
con mayor susceptibilidad a padecer infecciones, autoinflamacin,
autoinmunidad, alergia y cncer. El anlisis discriminante lineal es un
mtodo multivariante de clasificacin supervisada para agrupar a los
sujetos a partir de encontrar combinaciones lineales de un nmero de
variables.
Objetivo: identificar las caractersticas que mejor explican la perte-
nencia de pacientes peditricos con inmunodeficiencias primarias a
un grupo de defectos o a una enfermedad.
Material y mtodo: estudio analtico transversal en el que a partir de
una base de datos preexistente, con registros clnicos y de laboratorio
de 168 pacientes con inmunodeficiencia primaria, seguidos en el
Instituto Nacional de Pediatra de 1991 a 2012, construimos modelos
discriminantes lineales para explicar la pertenencia de cada paciente a
los diferentes grupos de defectos y a las inmunodeficiencias primarias
ms prevalentes en nuestro registro. Luego de una corrida preliminar se
incluyeron nicamente las 30 variables (4 demogrficas, 10 clnicas, 10
de laboratorio y 6 grmenes) de mayor peso, a partir de las que se cons-
truyeron los modelos de entrenamiento con el algoritmo paso-a-paso
(stepwise) hacia atrs, utilizando seleccin automatizada de variables
e incorporacin manual terica por un experto humano. Se evalu la
utilidad clnica de los modelos resultantes (sensibilidad, especificidad,
exactitud y coeficiente kappa), con intervalos de confianza de 95%.
Resultados: los modelos incluyeron 6 a 14 variables para explicar la
pertenencia de 168 pacientes con inmunodeficiencias primarias a los
cinco grupos ms numerosos (combinados, anticuerpos, bien definidos,
desregulacin y fagocitosis) y las cuatro enfermedades ms prevalentes Recibido: 18 de noviembre 2014
(agammaglobulinemia ligada al cromosoma X, enfermedad granuloma- Aceptado: 27 de enero 2015
tosa crnica, inmunodeficiencia comn variable y ataxia-telangiectasia).
Prcticamente en todos los casos el desempeo de la mquina fue Correspondencia: Dr. Sal O Lugo Reyes
superior al del experto humano en lo que respecta a la seleccin de los
Unidad de Investigacin en Inmunodeficiencias
atributos ms pertinentes para incorporar en los modelos. La prediccin
Instituto Nacional de Pediatra
del diagnstico con base en las ecuaciones construidas tuvo exactitud
Av. del Imn 1, Torre de Investigacin, piso 9
global de 83 a 94%, con sensibilidad de 60 a 100%, especificidad de
04530 Mxico, DF
83 a 95% y coeficiente kappa de 0.37 a 0.76.
dr.lugo.reyes@gmail.com
Conclusiones: la seleccin de variables, en general, tiene plausibilidad
clnica y tiene la ventaja prctica de utilizar solamente atributos clnicos, Este artculo debe citarse como
grmenes encontrados y estudios de laboratorio de rutina (biometra Murata C, Ramrez AB, Ramrez G, Cruz A y col.
hemtica e inmunoglobulinas sricas). El desempeo del modelo como Anlisis discriminante para predecir el diagnstico
herramienta de prediccin fue aceptable. Las principales limitaciones clnico de inmunodeficiencias primarias: reporte
del estudio incluyen un tamao de muestra limitado, lo que no permiti preliminar. Revista Alergia Mx 2015;62:125-133.

125
Revista Alergia Mxico Volumen 62, Nm. 2, abril-junio 2015

que realizramos validacin cruzada en la evaluacin. ste es solamente


un primer paso en la construccin de un sistema de aprendizaje au-
tomtico, con un abordaje ms amplio que incluya una base de datos
ms grande y diferentes metodologas, para asistir el diagnstico clnico
de las inmunodeficiencias primarias.
Palabras clave: anlisis discriminante, diagnstico clnico, inmunodefi-
ciencias primarias, aprendizaje automtico, asistido por computadora,
experto vs mquina.

Discriminant analysis to predict


the clinical diagnosis of primary
immunodeficiencies: a preliminary report
ABSTRACT
Background: The features in a clinical history from a patient with sus-
pected primary immunodeficiency (PID) direct the differential diagnosis
through pattern recognition. PIDs are a heterogeneous group of more
than 250 congenital diseases with increased susceptibility to infection,
inflammation, autoimmunity, allergy and malignancy. Linear discrimi-
nant analysis (LDA) is a multivariate supervised classification method
to sort objects of study into groups by finding linear combinations of a
number of variables.
Objective: To identify the features that best explain membership of
pediatric PID patients to a group of defect or disease.
Material and method: An analytic cross-sectional study was done with
a pre-existing database with clinical and laboratory records from 168
patients with PID, followed at the National Institute of Pediatrics during
1991-2012, it was used to build linear discriminant models that would
explain membership of each patient to the different group defects and
to the most prevalent PIDs in our registry. After a preliminary run only
30 features were included (4 demographic, 10 clinical, 10 laboratory, 6
germs), with which the training models were developed through a stepwise
regression algorithm. We compared the automatic feature selection with
a selection made by a human expert, and then assessed the diagnostic
usefulness of the resulting models (sensitivity, specificity, prediction ac-
curacy and kappa coefficient), with 95% confidence intervals.
Results: The models incorporated 6 to 14 features to explain member-
ship of PID patients to the five most abundant defect groups (combined,
antibody, well-defined, dysregulation and phagocytosis), and to the four
most prevalent PID diseases (X-linked agammaglobulinemia, chronic
granulomatous disease, common variable immunodeficiency and ataxia-
telangiectasia). In practically all cases of feature selection the machine
outperformed the human expert. Diagnosis prediction using the equa-
tions created had a global accuracy of 83 to 94%, with sensitivity of 60
to 100%, specificity of 83 to 95% and kappa coefficient of 0.37 to 0.76.

126
Revista

Mxico
Murata C y col. Diagnstico clnico de inmunodeficiencias primarias

Conclusions: In general, the selection of features has clinical plausi-


bility, and the practical advantage of utilizing only clinical attributes,
infecting germs and routine lab results (blood cell counts and serum
immunoglobulins). The performance of the model as a diagnostic tool
was acceptable. The studys main limitations are a limited sample size
and a lack of cross validation. This is only the first step in the construc-
tion of a machine learning system, with a wider approach that includes
a larger database and different methodologies, to assist the clinical
diagnosis of primary immunodeficiencies.
Key words: discriminant analysis, clinical diagnosis, primary immuno-
deficiencies, automatic learning, computed-assised, expert vs machine.

ANTECEDENTES medades es el discriminante lineal. La meta de


este mtodo es clasificar correctamente la perte-
Las inmunodeficiencias primarias son un grupo nencia de un elemento a un grupo con base en
heterogneo de ms de 200 enfermedades ge- la funcin discriminante. Se entrena el modelo
nticas con incidencia global aproximada de 1 con casos disponibles, de los que se conoce la
en 10,000 recin nacidos vivos.1 Su manifesta- pertenencia a categoras de inters, junto con los
cin clnica es variable, la mayor parte de ellas atributos que sern elegidos para la construccin
confiere ms susceptibilidad a grmenes y se del modelo. Con la funcin discriminante se cal-
manifiestan principalmente como infecciones cula la probabilidad de un nuevo caso problema
inusuales, graves, persistentes o de repeticin. de pertenecer a una categora especfica.5
Los antecedentes familiares, la consanguinidad,
la edad de inicio, el sexo, los sitios de infeccin, En Medicina, el modelo discriminante lineal se
las manifestaciones asociadas, las complicacio- ha utilizado principalmente en la evaluacin
nes, los hallazgos de laboratorio y los grmenes de ensayos clnicos con mltiples variables de
aislados son caractersticas a tomar en cuenta desenlace y en la seleccin de atributos para
para orientar el diagnstico clnico de las inmu- la reduccin de dimensionalidad. En el campo
nodeficiencias primarias. de diagnstico mdico se conocen como ante-
cedentes exitosos: la distincin temprana entre
El diagnstico clnico incluye la seleccin de trastorno bipolar y esquizofrenia en adolescentes,6
atributos relevantes y el reconocimiento de procesamiento de electroencefalogramas para
patrones,2,3 un proceso complejo que requiere diagnosticar autismo7 y la clasificacin de tejidos
contemplar varias combinaciones de variables con base en expresin gnica,8 entre otros.5
y para la mente humana puede ser difcil cubrir
todas las posibilidades;4 una herramienta com- En la actualidad existen ms de 250 inmuno-
putacional que genere el diagnstico diferencial deficiencias primarias identificadas y se estima
automatizado basado en modelos estadsticos que para el ao 2020 alcancen ms de 2,000.
puede complementar y facilitar esta tarea. La cantidad de expertos en inmunodeficiencias
primarias es escasa en Mxico y el mundo, por lo
Uno de los modelos estadsticos que se utilizan que consideramos til el desarrollo de un sistema
para ayudar a establecer diagnsticos de enfer- de aprendizaje automtico que pueda optimizar

127
Revista Alergia Mxico Volumen 62, Nm. 2, abril-junio 2015

y facilitar el proceso diagnstico y que sea acce- microorganismos infectantes y hallazgos de


sible para mdicos de otras especialidades y en laboratorios, incluidos stos solamente en la
hospitales apartados geogrficamente. citometra hemtica y las concentraciones s-
ricas de inmunoglobulinas (IgG, IgA, IgM). Por
En este estudio reportamos los resultados prelimi- medio de una corrida de filtracin de atributos,
nares de un proyecto en proceso de realizacin, se seleccionaron 30 variables (4 demogrficas,
cuyo objetivo es obtener modelos discriminantes 10 clnicas, 10 de laboratorio y 6 de cultivo)
lineales para establecer el diagnstico de cinco con base en un valor menor de p, para incluir
tipos de inmunodeficiencias primarias y cuatro en modelos de entrenamiento del modelo dis-
enfermedades de inmunodeficiencias primarias criminante lineal (Cuadro 1). La seleccin de
de frecuencia relativamente alta, evaluar la utili- variables se realiz con el algoritmo de stepwise
dad de la prueba diagnstica de estos modelos, hacia atrs, instalado en el paquete estadstico
as como compararlos con los modelos cons- JMP11 de SAS Institute, Inc.; las categoras de
tituidos mediante las variables seleccionadas referencia fueron el diagnstico establecido por
por un mdico inmunlogo pediatra experto en los mdicos mencionados.
inmunodeficiencias primarias.
De manera independiente, un mdico inmun-
MATERIAL Y MTODO logo, experto en inmunodeficiencias primarias
en poblacin peditrica, seleccion variables de
Estudio analtico transversal en el que usamos importancia terica entre las mismas 30 variables
una base de datos con registros clnicos y de la- que se utilizaron para obtener modelos discrimi-
boratorio de 168 pacientes peditricos de casos nantes, para cada uno de los cinco grupos y cuatro
atendidos y en seguimiento en el Instituto Na- enfermedades de inmunodeficiencias primarias.
cional de Pediatra entre 1991 y marzo de 2012, Los modelos construidos por medio de la seleccin
para construir los modelos discriminantes, con de variables automatizada y la seleccin terica
el fin de predecir la pertenencia de un paciente de variables por el mdico experto se sometieron
a uno de cinco grupos de defectos (celulares o a la evaluacin de utilidad de prueba diagnstica,
combinados [Grupo I], predominantemente de que incluy: sensibilidad, especificidad, exactitud
anticuerpos [Grupo II], sndromes bien definidos global y el coeficiente kappa de Cohen.
[Grupo III], desregulacin inmunitaria [Grupo IV]
y defectos de la fagocitosis [Grupo V]), y a una Se compararon tambin las variables selec-
de cuatro enfermedades (agammaglobulinemia cionadas por diferentes modalidades de la
ligada al cromosoma X, inmunodeficiencia co- construccin: algoritmo automatizado basado en
mn variable, ataxia-telangiectasia y enfermedad la funcin discriminante versus el juicio del ex-
granulomatosa crnica). Los diagnsticos los perto, as como su nmero de variables incluidas
establecieron mdicos especialistas del Servicio en el modelo. Los estimadores de parmetros se
de Inmunologa clnica del Instituto Nacional de reportaron con su intervalo de confianza de 95%.
Pediatra, con base en una historia clnica com- Todos los anlisis estadsticos se realizaron con el
patible y estudios de laboratorio y moleculares, paquete estadstico JMP11 del SAS Institute, Inc.
de acuerdo con criterios internacionales.
RESULTADOS
Se incluyeron variables demogrficas, anteceden-
tes familiares, de infecciones, manifestaciones Las caractersticas de los pacientes se muestran
asociadas y complicaciones, aislamiento de en el Cuadro 2. Los resultados de la evalua-

128
Revista

Mxico
Murata C y col. Diagnstico clnico de inmunodeficiencias primarias

Cuadro 1. Treinta variables preseleccionadas que explican mejor la pertenencia a las distintas categoras, de acuerdo con un
valor de p menor, mediante el modelo discriminante lineal

Demogrficas Clnicas De laboratorio Cultivo

Edad Adenitis Anemia Bacterias gramnegativas


Edad al diagnstico Celulitis-osteomielitis Eosinofilia Hongos
Sexo Autoinmunidad IgA baja Protozoarios
Consanguinidad Alergia IgA elevada Micobacterias
Infeccin urinaria IgG baja Virus
Cncer IgM baja Ningn aislamiento
Ningn sitio Leucopenia
Pulmn Linfopenia
Aparato gastrointestinal Neutropenia
Oncolgica Trombocitopenia

Cuadro 2. Algunas caractersticas de 168 pacientes con in- utilidad diagnstica, comparado con el modelo
munodeficiencias primarias (IDP) y prevalencia por grupos basado en la seleccin terica de variables por
y cuatro enfermedades
el experto humano.
Variables
El anlisis discriminante para el grupo I, De-
Edad actual (aos) 10.8 5.8
Edad de diagnstico de inmunodeficiencia 5.0 4.2
fectos celulares o combinados, identific como
primaria (aos) variables pertinentes para el modelo: edad al
Sexo (femenino-masculino) 55-113 diagnstico, infecciones del tubo gastroin-
Consanguinidad 18 testinal, adenitis, manifestaciones alrgicas,
Grupo de inmunodeficiencia primaria leucopenia e IgM baja. Tambin, curiosamente,
I : combinados 9
ningn sitio de infeccin se incluy en el
II: de anticuerpos 57
modelo. Estas siete variables predicen la perte-
III: sndromes bien definidos 43
IV: desregulacin inmunitaria 8 nencia al grupo I en nuestra base de datos con
V: defectos de la fagocitosis 44 100% de sensibilidad, 91% de especificidad y
VI: inmunidad innata 2 91% de exactitud. La pertenencia al grupo II,
VII: autoinflamatorios 1 Defectos predominantemente de anticuerpos,
VIII: complemento 3 se explica mediante el modelo discriminante
Enfermedad
lineal por siete variables: edad al diagnstico,
Agammaglobulinemia ligada al cromoso- 29
ma X adenitis, ningn sitio, aislamiento de bacterias
Inmunodeficiencia comn variable 13 gramnegativas, leucopenia, IgG e IgA bajas;
Ataxia-telangiectasia 24 con sensibilidad de 78%, especificidad de 95%,
Enfermedad granulomatosa crnica 27 exactitud de 89% e ndice de concordancia
kappa de 0.75. El modelo para explicar la per-
tenencia al grupo diagnstico III, Sndromes
cin de la utilidad de la prueba diagnstica bien definidos, incorpor ocho variables: edad,
para los cinco grupos y cuatro enfermedades edad al diagnstico, adenitis, hongos, linfope-
de inmunodeficiencias primarias se muestran nia, eosinofilia, trombocitopenia e IgG baja.
en los Cuadros 3 y 4. En la mayor parte de los Alcanz sensibilidad de 83%, especificidad
modelos el procedimiento automatizado tuvo de 78%, exactitud de 80% y coeficiente kappa
igual o mejor rendimiento en los parmetros de de 0.55. El anlisis discriminante del grupo IV,

129
130

Cuadro 3. Variables seleccionadas por el procedimiento automatizado y por el juicio terico del experto para establecer el diagnstico diferencial de los cinco tipos ms

Revista Alergia Mxico


numerosos de inmunodeficiencias primarias

Variables Grupo I Grupo II Grupo III Grupo IV Grupo V


Seleccin de variables por MDL Experto MDL Experto MDL Experto MDL Experto MDL Experto

Demogrficas Sexo
Consanguinidad
Edad Edad
Edad al diag-
nstico de IDP
Sitio Pulmn
Tubo gastroin-
testinal
Vas urinarias
Adenitis
Celulitis-ostetis
Piel mucosa
Ninguno
Agente Gramnegativo
Hongo
Virus
Micobacteria
Protozoario
Ninguno
Manifestacin Autoinmunitaria
no infecciosa Alergia
Oncolgica
Citometra Anemia
hemtica Leucopenia
Neutropenia
Linfopenia
Eosinofilia

Volumen 62, Nm. 2, abril-junio 2015


Trombocito-
penia
Inmunoglobulinas IgG baja
IgM baja
IgA baja
IgA elevada
Nmero de variables 8 11 8 13 10 14 6 11 8 17
Sensibilidad (%) 100 (100-100) 100 (100-100) 78 (67-90) 76 (65-88) 83 (71-94) 81 (73-89) 60 (17-100) 60 (17-100) 87 (75-99) 73 (58-89)
Especificidad (%) 94 (90-98) 92 (87-96) 95 (90-99) 93 (88-98) 83 (75-90) 67 (52-81) 95 (91-99) 93 (89-98) 87 (81-93) 91 (86-96)
Exactitud global (%) 94 (91-98) 92 (88-97) 89 (84-94) 97 (82-93) 83 (76-89) 77 (70-84) 94 (90-98) 92 (88-97) 87 (81-92) 87 (82-93)
Coeficiente kappa 0.64 0.49 0.75 0.72 0.61 0.45 0.37 0.32 0.65 0.63
(0.41-0.87) (0.24-0.74) (0.63-0.86) (0.59-0.84) (0.47-0.74) (0.30-0.62) (0.05-0.69) (0.02-0.61) (0.51-0.79) (0.47-0.78)
Grupo I: defectos celulares o combinados; Grupo II: defectos predominantemente de anticuerpos; Grupo III: sndromes bien definidos; Grupo IV: desregulacin inmu-
nitaria; Grupo V: defectos de la fagocitosis.
MDL: modelo discriminante lineal.
Cuadro 4. Variables seleccionadas por el procedimiento automatizado y por el juicio terico del experto para establecer el diagnstico diferencial de las cuatro enferme-

Murata C y col. Diagnstico clnico de inmunodeficiencias primarias


dades ms prevalentes

Variables Agammaglobulinemia ligada Inmunodeficiencia comn Enfermedad granulomatosa Ataxia-telangiectasia


al cromosoma X variable crnica
Seleccin de variables por MDL Experto MDL Experto MDL Experto MDL Experto

Demogrficas Sexo
Consanguinidad
Edad Edad
Edad al diagnstico
de inmunodeficien-
cia primaria
Sitio Pulmn
Tubo gastrointestinal
Vas urinarias
Adenitis
Celulitis-ostetis
Piel mucosa
Ninguno
Agente Gramnegativo
Hongo
Virus
Micobacteria
Protozoario
Ninguno
Manifestacin Autoinmunitaria
no infecciosa Alergia
Oncolgica
Citometra Anemia
hemtica Leucopenia
Neutropenia
Linfopenia
Eosinofilia
Trombocitopenia
Inmunoglobu- IgG baja
linas IgM baja
IgA baja
IgA elevada
Nmero de variables 7 7 7 9 14 8 10 7
Sensibilidad (%) 96 (88-100) 96 (87-100) 92 (78-100) 85 (65-100) 90 (77-100) 60 (39-81) 87 (73-100) 78 (61-95)

Revista
Especificidad (%) 86 (80-93) 82 (75-89) 93 (77-90) 85 (79-91) 94 (89-98) 90 (84-95) 94 (90-98) 88 (82-94)
Exactitud global (%) 88 (83-93) 84 (78-90) 84 (78-04) 95 (79-91) 93 (89-97) 86 (80-91) 93 (89-97) 86 (81-92)
ndice kappa 0.66 0.49 0.44 0.44 0.74 0.45 0.76 0.56
(0.51-0.80) (0.24-0.74) (0.26-0.62) (0.25-0.63) (0.59-0.89) (0.25-0.65) (0.62-0.90) (0.39-0.73)

Mxico
MDL: modelo discriminante lineal.
131
Revista Alergia Mxico Volumen 62, Nm. 2, abril-junio 2015

Desregulacin inmunitaria, arroj como va- DISCUSIN


riables relevantes ningn sitio de infeccin,
virus y linfopenia; con sensibilidad de 50%, Exploramos una base de datos con registros
especificidad de 97% y exactitud de 92%, con reales de 168 pacientes peditricos con diagns-
coeficiente kappa de 0.28. El grupo V, Defectos tico conocido de inmunodeficiencias primarias.
de la fagocitosis, se explicara principalmente El anlisis automatizado mediante el modelo
por nueve variables: infeccin pulmonar, infec- discriminante lineal permiti identificar varios
cin gastrointestinal, celulitis-ostetis, alergia, atributos demogrficos, clnicos y de laboratorio
micobacterias, neutropenia, eosinofilia, trom- que explican la pertenencia de los sujetos al
bocitopenia e IgA baja. Los grupos VI, VII y VIII grupo o la enfermedad en la que estn clasifica-
no tuvieron suficientes pacientes para efectuar dos, con desempeo del modelo predictivo muy
un anlisis de clasificacin. aceptable, a pesar de que slo se incorporaron
variables clnicas y de laboratorio de rutina
Los diagnsticos ms prevalentes en la base de (biometra hemtica, cultivo e inmunoglobu-
datos incluyeron: agammaglobulinemia ligada linas sricas). La sensibilidad, especificidad y
al cromosoma X, inmunodeficiencia comn exactitud alcanzadas se mantuvieron en los
variable, ataxia-telangiectasia y enfermedad lmites de 80 y 98% en la mayora de los casos.
granulomatosa crnica. Aplicamos el modelo Desde el punto de vista clnico y didctico, las
discriminante lineal para explicar y predecir variables incluidas en los modelos construidos
el diagnstico de pacientes con estas cuatro por el procedimiento automatizado mostraron
enfermedades y encontramos: para agammaglo- interpretabilidad plausible desde el punto de
bulinemia ligada al cromosoma X, cinco variables: vista terico, aunque la discrepancia entre la
sexo, IgG e IgM bajas, protozoarios y bacterias seleccin de variables por estos modelos y por
gramnegativas; con sensibilidad de 92%, especi- el juicio del experto fue importante.
ficidad de 86%, exactitud de 87% y coeficiente
kappa de 0.62. Para la inmunodeficiencia comn Nuestro estudio tiene varias limitaciones. Pri-
variable, dos variables: edad al diagnstico e IgG mero, debido al tamao de muestra reducido,
baja, con sensibilidad de 85%, especificidad de sobre todo de algunos grupos y de enfermedad
82%, exactitud de 82% y coeficiente kappa de de inmunodeficiencias primarias, en este re-
0.37. Para ataxia-telangiectasia, nueve variables: porte preliminar no se pudo realizar validacin
infeccin en ningn sitio, autoinmunidad, cruzada, que es indispensable para evitar el
cncer, anemia, neutropenia, linfopenia, IgG, sobreajuste del modelo para los datos de los
IgM e IgA bajas; la prediccin con este modelo que se crearon los mismos modelos. De hecho,
alcanz 87% de sensibilidad, 95% de especi- se esperaba que entre el diagnstico de refe-
ficidad, 93% de exactitud y coeficiente kappa rencia y el diagnstico generado por el modelo
de 0.75. Para la enfermedad granulomatosa se observaran buenas concordancias. En este
crnica se incorporaron en el modelo 10 va- punto lo que parece ms importante es que,
riables: infeccin pulmonar, infeccin urinaria, primero, entre los modelos automticos y mo-
adenitis, celulitis-ostetis, alergia, neutropenia, delos tericos elaborados por el mdico experto
eosinofilia, trombocitopenia, IgG e IgA bajas; en inmunodeficiencias primarias se observaron
con lo que se alcanz 90% de sensibilidad, 90% niveles muy similares de los valores de utilidad
de especificidad, exactitud de 90% y coeficiente diagnstica, y segundo, a pesar de la discrepan-
kappa de 0.66. cia en la seleccin de variables entre los modelos

132
Revista

Mxico
Murata C y col. Diagnstico clnico de inmunodeficiencias primarias

automtico y terico, en la primera se reconoce REFERENCIAS


una coherencia con la lgica biolgica. Asimis-
mo, los niveles de concordancia determinados 1. Al-Herz W, Bousfiha A, Casanova J-L, Chapel H, et al. Primary
immunodeficiency diseases: an update on the classification
por medio del coeficiente kappa fueron similares
from the international union of immunological societies
en ambos procedimientos. expert committee for primary immunodeficiency. Front
Immunol [Internet]. 2011 Jan;2:54. Available from: http://
www.pubmedcentral.nih.gov/articlerender.fcgi?artid=334
Realizar el estudio con un mayor nmero de
2372&tool=pmcentrez&rendertype=abstract
casos incorporados en la base de datos permi-
2. Sherbino J, Dore KL, Siu E, Norman GR. The effectiveness of
tir incluir la validacin cruzada, con la que cognitive forcing strategies to decrease diagnostic error: an
esperamos obtener conclusiones ms genera- exploratory study. Teach Learn Med [Internet]. 2011/01/18
lizables. En la actualidad estamos en proceso ed. 2011;23:78-84. Available from: http://www.ncbi.nlm.
nih.gov/pubmed/21240788
de realizar la construccin de la base de datos
3. Groves M, ORourke P, Alexander H. The clinical reasoning
que incluir alrededor de 500 casos y es muy characteristics of diagnostic experts. Med Teach [Internet].
probable que esta nueva base de datos permita 2003/07/26 ed. 2003;25:308-313. Available from: http://
generar los resultados con mayor estabilidad y www.ncbi.nlm.nih.gov/pubmed/12881056
ms generalizables. 4. Sajda P. Machine learning for detection and diagnosis of
disease. Annu Rev Biomed Eng [Internet]. 2006 [cited 2014
May 3]; Available from: http://www.annualreviews.org/
Hasta donde sabemos, sta es la primera doi/abs/10.1146/annurev.bioeng.8.061505.095802
vez que se aplica el modelo discriminante 5. Cleophas TJ, Zwinderman AH. Machine Learning in Medi-
lineal para predecir el diagnstico clnico de cine [Internet]. Vasa. Springer; 2013 [cited 2014 Feb 14].
Available from: http://medcontent.metapress.com/index/
inmunodeficiencias primarias. Los resulta- A65RM03P4874243N.pdf
dos alentadores de este estudio explorador 6. Pardo PJ, Georgopoulos AP, Kenny JT, Stuve TA, et al. Clas-
sugieren la factibilidad de un abordaje ms sification of adolescent psychotic disorders using linear
completo y extenso de prediccin y asistencia discriminant analysis. Schizophr Res [Internet]. 2006 Oct
[cited 2014 Nov 7];87:297-306. Available from: http://
al diagnstico clnico por medio de mtodos www.ncbi.nlm.nih.gov/pubmed/16797923
de aprendizaje automtico. El siguiente paso 7. Kamel MI, Alhaddad MJ, Malibary HM, Thabit K, et al. EEG
es, adems de incluir la validacin cruzada que based autism diagnosis using regularized Fisher Linear
falt en este reporte preliminar, probar con otros Discriminant Analysis. IJ Image, Graph Signal Process.
2012;3:35-41.
modelos de aprendizaje automtico que mues-
8. Ye J, Li T, Xiong T, Janardan R. Using uncorrelated discriminant
tran buenos rendimientos para la prediccin del
analysis for tissue classification with gene expression data.
diagnstico,9-11 como el modelo de regresin IEEE/ACM Trans Comput Biol Bioinform 2004;1:181-190.
logstica, mquinas de soporte vectorial, redes 9. Krawczyk B, Simi D, Simi S, Woniak M. Automatic diag-
neuronales artificiales, entre otros. nosis of primary headaches by machine learning methods.
Cent Eur J Med [Internet]. 2012 Nov 16 [cited 2014 Jan
29];8:157-165. Available from: http://www.springerlink.
Agradecimientos com/index/10.2478/s11536-012-0098-5
10. Chen H, Yang B, Wang G. Support vector machine based
Estos resultados se presentaron durante la reu- diagnostic system for breast cancer using swarm intelligen-
ce. 2012;(February 2011):250519.
nin semestral de la Asociacin de Investigacin
11. Cherkassky M. Application of machine learning methods to
Peditrica en Mazatepec, Morelos, 2014, y las medical diagnosis. Chance [Internet]. 2009 Feb 15;22:42-
observaciones y comentarios ah vertidos nos 50. Available from: http://link.springer.com/10.1007/
permitieron enriquecer este manuscrito. s144-009-0007-0

133

También podría gustarte