Está en la página 1de 17

Suscríbete a DeepL Pro para poder traducir archivos de mayor tamaño.

Más información disponible en www.DeepL.com/pro.

bioingeniería

Artículo
Aprendizaje automático para el diagnóstico de
extracciones ortodóncicas: Un análisis computacional
mediante aprendizaje conjunto
Yasir Suhail 1,* , Madhur Upadhyay 2 , Aditya Chhibber 3 y Kshitiz 1,*
1 Departamento de Ingeniería Biomédica, Centro de Salud de la Universidad de
Connecticut, Farmington, CT 06032, EE.UU.
2 División de Ortodoncia, Facultad de Medicina Dental, Centro de Salud de la Universidad de Connecticut,
Farmington, CT 06032, EE.UU.; maupadhyay@uchc.edu
3 Práctica privada, Norwalk, OH 44857, EE.UU.; adityachhibber14@gmail.com
* Correspondencia: yasir.suhail@uconn.edu (Y.S.); kshitiz@uchc.edu (K.)
comprobar
Recibido: 1 de mayo de 2020; Aceptado: 10 de junio de 2020; Publicado: ror
12 de junio de 2020 actualiza

Resumen: La extracción de dientes es una decisión de tratamiento importante en la práctica


ortodóncica. Un sistema experto capaz de llegar a decisiones de tratamiento adecuadas puede ser
valioso para los clínicos a la hora de verificar los planes de tratamiento, minimizar los errores
humanos, formar a los ortodoncistas y mejorar la fiabilidad. En este trabajo, entrenamos una serie de
modelos de aprendizaje automático para esta tarea de predicción utilizando datos de 287 pacientes,
evaluados de forma independiente por cinco ortodoncistas diferentes. Demostramos por qué los
métodos ensemble son especialmente adecuados para esta tarea. Evaluamos el rendimiento de los
modelos de aprendizaje automático e interpretamos el comportamiento del entrenamiento.
Demostramos que los resultados de nuestro modelo se aproximan al nivel de acuerdo entre
diferentes ortodoncistas.

Palabras clave: ortodoncia; red neuronal; aprendizaje automático; bosques aleatorios; métodos
ensemble

1. Introducción
La extracción de dientes es una de las decisiones más críticas y controvertidas en el tratamiento
ortodóncico, en gran parte porque las extracciones son irreversibles [1,2]. Estas decisiones se basan
en evaluaciones clínicas, fotografías del paciente, modelos de estudio dental, radiografías, y
dependen sustancialmente de la experiencia y los conocimientos del clínico. Una decisión
equivocada puede conducir a resultados indeseables como una estética subóptima, una mordida
inadecuada, anomalías funcionales relacionadas con la masticación y el habla y, en el peor de los
casos, un tratamiento inacabado. Hasta la fecha, la decisión de extraer dientes no está formalizada ni
estandarizada, y depende de la heurística del profesional [3]. Esto provoca a menudo variabilidad
intraclínica e interclínica en el proceso de toma de decisiones [4,5]. Por lo tanto, para cientos de estudiantes,
residentes, ortodoncistas y odontólogos de todo el mundo, el diagnóstico y la planificación del
tratamiento suponen un reto importante. La brecha resultante en el conocimiento o la interpretación
de los datos puede ser crítica. Por lo tanto, para estandarizar el proceso de toma de decisiones, se
necesitan enfoques más novedosos.
En este estudio, pretendemos crear un modelo de toma de decisiones de inteligencia artificial
para el diagnóstico de extracciones utilizando el aprendizaje automático de redes neuronales. Los
objetivos principales del estudio eran (1) desarrollar un modelo de toma de decisiones que simule las
decisiones de los expertos sobre si es necesario extraer o no un diente basándose en registros
estandarizados de pretratamiento ortodóncico (fotografías y radiografías del paciente), y (2)
determinar los elementos de conocimiento necesarios para formular decisiones de tratamiento
ortodóncico de extracción/no extracción. Se esperaba que el modelo de diagnóstico creado
coincidiera con el diagnóstico de un experto, tanto en la toma de decisiones binarias (resultados de
extracción frente a resultados de no extracción), como en el proceso de toma de decisiones más
resuelto del que se seguiría un resultado de extracción específico (de los 13 resultados posibles).
Este método no sólo limitaría la variabilidad en

Bioingeniería 2020, 7, 55; doi:10.3390/bioengineering7020055 www.mdpi.com/journal/bioengineering


Bioingeniería 2020, 7, 55 2 de 17

toma de decisiones en ortodoncia, sino también limitar los efectos adversos de los protocolos de extracción
dental prescritos erróneamente. Además, esto también podría servir como herramienta de prueba para
formar a dentistas y estudiantes de ortodoncia. Registros de pretratamiento de ortodoncia en forma
de fotos extraorales, fotos intraorales,
y se recogieron radiografías cefalométricas. Un panel de ortodoncistas experimentados (en adelante
también denominados expertos) evaluó los registros individualmente y predijo el resultado final de
extracción/no extracción.

2. Materiales y métodos

2.1. Recogida de datos y selección de características


Los datos consistieron en 300 historiales de pacientes pretratamiento obtenidos en una consulta privada
de Norwalk, Ohio, EE.UU. (ortodoncista: C . A ). Para cada sujeto se emplearon historiales médicos y registros
de diagnóstico convencionales, como radiografías laterales de la cabeza (radiografías cefalométricas),
radiografías panorámicas, fotografías faciales y fotografías intraorales, que C.A revisó para comprobar
que estaban completos. Todos los sujetos tenían dentición permanente completa excepto el tercer molar, no
presentaban anomalías de las formas craneofaciales ni deformidades esqueléticas, y no tenían
antecedentes de tratamiento ortodóncico. Se seleccionaron 19 variables o elementos que caracterizan
los problemas ortodóncicos y que se supone que son importantes a la hora de decidir si es necesario
extraer dientes o no. Esta selección se basó en la bibliografía existente sobre ortodoncia. Para todos los
sujetos, 5 expertos (C.A, V.M, D.S, C.P.J,), con una experiencia media de aproximadamente 9 años
entre ellos, examinaron los historiales de cada paciente basándose en las variables de características
preseleccionadas. Cada experto también registró sus dos resultados diagnósticos más probables (de
14 opciones disponibles) y los clasificó como tratamiento primario y tratamiento alternativo.
Uno de los autores (U.M) recopiló y evaluó los datos para detectar posibles errores. Se
eliminaron conjuntos de datos de trece pacientes debido a registros incompletos y errores en el
registro de datos.

2.2. Análisis computacional


Las características proporcionadas por los expertos y los datos de las decisiones se analizaron
utilizando la plataforma R [6]. El modelo de red neuronal se construyó con el paquete nnet [7],
mientras que los bosques aleatorios se construyeron y evaluaron con el paquete RandomForest [8].
Todos los cálculos se realizaron mediante validación cruzada quíntuple. Se utilizaron los mismos
conjuntos de validación cruzada para cada modelo y determinación de hiperparámetros. La figura 1
muestra el esquema de la recogida de datos y el análisis computacional.

Figura 1. Esquema del procedimiento seguido en este trabajo, desde la recogida de datos hasta el
diagnóstico por aprendizaje automático.

3. Resultados
Recopilamos datos de 287 pacientes de cinco expertos diferentes. Cada experto asignó valores
a 19 características diagnósticas preseleccionadas basándose en imágenes cefalométricas y fotografías
del paciente, además de seleccionar una opción de tratamiento principal y otra alternativa. Los
expertos podían decidir entre uno de los dos resultados binarios: no extracción o extracción. Dentro
Bioingeniería 2020, 7, 55 3 de 17
del plan de extracción, según
Bioingeniería 2020, 7, 55 4 de 17

para determinar qué diente o dientes requerían extracción, los expertos tenían que seleccionar un
resultado (específico) de entre las 13 opciones diferentes (2-14) que se ofrecían (Figura 2). Lo más
importante es que los expertos también opinaron sobre el segundo resultado preferido (denominado
resultado alternativo), lo que, teniendo en cuenta la variabilidad entre las opiniones de los expertos,
nos permitió comprobar la exactitud de nuestros resultados de una manera más sólida.

Figura 2. Índice de las diferentes opciones de extracción Índice de las distintas opciones de
extracción. El diagrama de la izquierda muestra la ubicación de los premolares superiores e
inferiores. Las 14 opciones de la derecha enumeran los procedimientos de extracción específicos en
función de la ubicación de los dientes. NE significa sin extracción.

3.1. Análisis exploratorio


Se utilizaron los datos de 287 pacientes. La distribución por edad y sexo se muestra en la figura
3.

Figura 3. Antecedentes demográficos de los pacientes. Antecedentes demográficos de los pacientes. (A)
Distribución por edades y (B) distribución por sexos.

En primer lugar, queríamos establecer el grado de acuerdo entre los expertos que evaluaron a
los pacientes incluidos en este estudio. Si los múltiples planes de tratamiento seleccionados por los
distintos expertos se consideran el patrón oro para un método de aprendizaje automático, el acuerdo
entre expertos debería proporcionarnos un límite práctico superior sobre la precisión a alcanzar. El
acuerdo sobre el resultado primario del tratamiento entre los diferentes expertos varió del 65% al
71% (Tabla 1), y el acuerdo sobre el resultado primario o alternativo varió del 93% al 98% (Tabla 2). Estos
datos ponen de manifiesto que distintos expertos, bien formados en ortodoncia, podían diferir en sus
opiniones primarias en algunos aspectos.
Bioingeniería 2020, 7, 55 5 de 17

Tabla 1. Porcentaje de acuerdo sobre el resultado primario del tratamiento entre los distintos expertos.

Experto 1 Experto 2 Experto 3 Experto 4 Experto


5
Experto 1 100.0% 71.1% 64.8% 68.3% 69.0%
Experto 2 71.1% 100.0% 70.7% 71.8% 78.0%
Experto 3 64.8% 70.7% 100.0% 63.8% 69.7%
Experto 4 68.3% 71.8% 63.8% 100.0% 70.4%
Experto 5 69.0% 78.0% 69.7% 70.4% 100.0%

Tabla 2. Porcentaje de acuerdo sobre el resultado primario o alternativo del tratamiento entre los
distintos expertos.

Experto 1 Experto 2 Experto 3 Experto 4 Experto


5
Experto 1 100.0% 95.5% 94.4% 95.5% 96.5%
Experto 2 95.5% 100.0% 95.5% 95.1% 96.5%
Experto 3 94.4% 95.5% 100.0% 93.0% 96.2%
Experto 4 95.5% 95.1% 93.0% 100.0% 97.9%
Experto 5 96.5% 96.5% 96.2% 97.9% 100.0%

3.2. Modelos de aprendizaje automático

3.2.1. Clasificadores simples


Se pueden utilizar varios métodos diferentes para construir un clasificador para la predicción de
extracciones ortodóncicas. Consideramos los problemas gemelos de predecir si extraer dientes o no, y
el plan de tratamiento de extracción específico. Como problema de clasificación, teníamos una
predicción discreta, y utilizamos una red neuronal para aprender la regresión multinomial. Cada
neurona de salida aprende a predecir una extracción específica, tomando las entradas de los datos
brutos. No se utilizaron unidades ocultas. Además, se utilizó la regresión logística para predecir la
decisión binaria de extracción/no extracción. La figura 4 muestra el rendimiento del modelo de
regresión logística y del modelo de red neuronal de regresión multinomial. El modelo de regresión
logística, por definición, no era capaz de predecir el procedimiento de extracción específico. Sin
embargo, para el problema binario (extracción/no extracción), la regresión logística superó a la red
neuronal multinomial entrenada.
El siguiente paso para aumentar el rendimiento del modelo fue el uso de interacciones bidireccionales en
la regresión logística. Cada par de características se multiplicó y se utilizó como características
adicionales, generando un mayor número de parámetros. Aunque esto ayudó a reducir las tasas de
error de la muestra de entrenamiento, aumentó el error del conjunto de prueba, lo que indica que el
aumento de la complejidad del modelo condujo a un sobreajuste. Las interacciones bidireccionales
son más propensas al sobreajuste debido al mayor número de parámetros ajustables, y también
aumentan el tiempo de entrenamiento, como se ve en la Figura 5.
Para explorar las ventajas de incluir interacciones de orden superior frente al sobreajuste con
demasiados parámetros, aplicamos la regularización por peso a la red neuronal densa de dos capas.
Añadimos una penalización de regularización de peso para la norma L1, la norma L2 y una norma
L1 y L2 igualmente ponderadas como una red elástica. Las figuras 6 y 7 muestran los errores de
entrenamiento y prueba, respectivamente, para los tres esquemas de regularización frente al peso de
regularización.
Bioingeniería 2020, 7, 55 6 de 17

Figura 4. Rendimiento de los clasificadores individuales Rendimiento de los clasificadores


individuales, cuando se considera (A) sólo el diagnóstico primario, y (B) tanto el primario como el
alternativo.

Figura 5. Tiempo de entrenamiento de los clasificadores individuales. La regresión logística


también se entrenó con términos producto (es decir, interacciones bidireccionales), lo que aumentó
drásticamente el tiempo de entrenamiento. Debido al gran rango dinámico necesario en el eje y, se
dibuja en la transformada pseudolog.
Bioingeniería 2020, 7, 55 7 de 17

Figura 6. Efecto de la regularización del peso en el modelo de red neuronal/regresión multinomial


sobre el error del conjunto de entrenamiento. El eje x muestra el peso de regularización. La fila
superior corresponde a la red neuronal que utiliza las características de entrada sin procesar, mientras
que la fila inferior corresponde al uso de interacciones bidireccionales. Las 3 columnas muestran los
resultados para el término de penalización de regularización de peso formulado como una red
elástica, norma L1 y norma L2.

Figura 7. Efecto de la regularización del peso en el modelo de red neuronal/regresión multinomial


sobre el error del conjunto de prueba. El eje x muestra el peso de regularización, con filas y
columnas correspondientes a las interacciones y al método de regularización por peso como en la
Figura 6.
Bioingeniería 2020, 7, 55 8 de 17

Mientras que los errores de entrenamiento (Figura 6) aumentan monótonamente con pesos de
regularización más altos para las normas L1, L2 y combinadas (red elástica), las tasas de error de
prueba muestran una caída clásica para los pesos de regularización intermedios (Figura 7). La
adición de interacciones de segundo grado en los predictores lleva el error de entrenamiento casi a
cero (fila inferior de la Figura 6), mientras que el error de prueba aumenta un poco. Sin embargo, la
regularización contrarresta este exceso de ajuste.

3.2.2. Random Forest como clasificador conjunto


Dado que la adición de parámetros adicionales en el clasificador (como se observa en la
regresión logística con términos multiplicativos) conduce al sobreajuste, utilizamos un conjunto
de clasificadores para mejorar el rendimiento. Se sabe que los métodos de conjunto son resistentes
al sobreajuste. Entrenamos modelos de bosque aleatorio utilizando el algoritmo estándar y
variamos los principales hiperparámetros para conocer las limitaciones del rendimiento.
Cada árbol de decisión del bosque aleatorio se construyó utilizando un conjunto de datos
muestreados con reemplazo del conjunto de entrenamiento. Este proceso de bagging es una de las
formas en que cada árbol de decisión intenta captar un aspecto diferente de los datos. Durante la
construcción de cada árbol de decisión, se seleccionó aleatoriamente un pequeño número de
características en cada nivel y se utilizó la que más discriminaba entre las clases. El proceso
continuó hasta que cada nodo no contuvo más de un número mínimo específico de muestras.
Variamos estos hiperparámetros durante el entrenamiento del modelo de bosque aleatorio. Las
figuras 8 y 9 muestran el rendimiento frente a una serie de hiperparámetros necesarios para ajustarse
al tamaño de los datos disponibles. Observando los datos de entrenamiento por sí solos, era evidente
que (a) el rendimiento era mejor para tamaños de nodo mínimo más pequeños, ya que conducía a
árboles de decisión más profundos, (b) el número de características en cada división tenía un efecto
inicial, pero éste se saturaba al aumentar el número de características, y (c) incluso 50 árboles
mostraban un rendimiento estadísticamente indistinguible de los bosques aleatorios con un número mucho
mayor de árboles de decisión. Lo más notable es que el error de predicción no mostró sobreajuste en
los datos de prueba (es decir, no se observó un aumento de la tasa de error a medida que aumentaba
la complejidad del modelo).
Además, incluso los hiperparámetros relativamente más débiles (~25 árboles, un tamaño
mínimo de nodo de 4 y 6 características probadas en cada división) son lo suficientemente fuertes
como para saturar el rendimiento del conjunto de prueba, mientras que el rendimiento del conjunto
de entrenamiento sigue disminuyendo con modelos más complejos. Se observa un comportamiento
similar al observar la predicción de la extracción específica (Figura 8) y el problema binario de
predecir la extracción frente a la no extracción (Figura 9).
Dado que el algoritmo de bosque aleatorio tiene una muestra de datos fuera de bolsa para la
construcción de cada árbol de decisión, esta tasa de error fuera de bolsa puede utilizarse para
estudiar el efecto de añadir cada árbol adicional. La precisión fuera de bolsa, que es una
aproximación a la precisión en el conjunto de pruebas, se visualiza en la Figura 10, que muestra la
saturación del rendimiento en torno a 50 o 100 árboles en el modelo de bosque aleatorio.
Al comparar todos los clasificadores (Figura 11), queda claro que el clasificador de bosque aleatorio
supera al modelo de red neuronal para la predicción del tratamiento de extracción específico. La
regresión logística es capaz de lograr un rendimiento marginalmente mejor sólo para el caso de la
predicción binaria cuando se consideran tanto el diagnóstico principal como los diagnósticos
alternativos del experto (panel superior izquierdo de la Figura 8B).
Bioingeniería 2020, 7, 55 9 de 17

Figura 8. Efecto de varios parámetros de entrenamiento en el modelo de bosque aleatorio para la


predicción de la extracción específica. Se varían el tamaño mínimo de los nodos, las características
probadas en cada nivel de división y el número de árboles, y se representan las tasas de error para la
división de entrenamiento y de prueba. En (A), una predicción se considera un error si no coincide
con el diagnóstico primario del experto, y en (B), se considera un error si la predicción no coincide
con el diagnóstico primario o alternativo.
Bioingeniería 2020, 7, 55 10 de 17

Figura 9. Efecto de varios parámetros de entrenamiento en el modelo de bosque aleatorio para


el problema de predicción binaria Efecto de varios parámetros de entrenamiento en el modelo de
bosque aleatorio para el problema de predicción binaria. Se varían el tamaño mínimo de los nodos,
las características probadas en cada nivel de división y el número de árboles, y se representan las
tasas de error para la división de entrenamiento y de prueba. En (A), una predicción se considera un
error si no coincide con el diagnóstico principal del experto, y en (B), se considera un error si la
predicción no coincide con el diagnóstico principal o alternativo.

Figura 10. Efecto de saturación al aumentar el número de clasificadores en el bosque aleatorio. La precisión
fuera de la bolsa (una estimación de la precisión de la prueba) trazada frente al número de árboles para
el modelo de bosque aleatorio que predice el tipo específico de interacción. Esto es para un tamaño
de nodo mínimo de 1 y probando todas las características posibles en cada división.
Bioingeniería 2020, 7, 55 11 de 17

Figura 11. Rendimiento de todos los clasificadores para predecir Rendimiento de todos los
clasificadores para predecir (A) el diagnóstico principal, y (B) cuando se considera que la
concordancia con el diagnóstico principal o con los diagnósticos alternativos es exacta. Aquí se
incluyen tanto los clasificadores individuales como los conjuntos (bosque aleatorio).

3.2.3. Efectos de las características individuales


Queríamos saber si determinados predictores son especialmente influyentes en la decisión de
tratamiento en comparación con otros. Utilizar un número menor de predictores ayudaría a
minimizar el trabajo necesario en el entorno clínico para utilizar el sistema. Sin embargo, con un número
menor de predictores, cualquier error en la medición de predictores específicos puede dar lugar a un
error mayor en el diagnóstico final. Con este fin, realizamos un estudio de ablación de predictores en
el modelo de regresión multinomial/red neuronal. Medimos el efecto de eliminar cada predictor
individualmente en la tasa de error evaluada sobre el conjunto de pruebas, con una validación
cruzada de 5 veces. La figura 12 muestra que ningún subconjunto de predictores destaca por tener un
efecto significativamente mayor en el error de la prueba. Esto significa que no es probable que cada
error de medición en un predictor tenga un efecto catastrófico en el diagnóstico automático.
Bioingeniería 2020, 7, 55 12 de 17

Figura 12. Efecto de las características individuales. El error de prueba para la predicción del plan de
tratamiento específico utilizando la red neuronal después de eliminar de forma independiente
características individuales del conjunto de datos.

4. Debate
Estudios anteriores han abordado este problema utilizando el aprendizaje automático mediante
una red neuronal [9,10]. Sin embargo, estos enfoques se han visto limitados por varias deficiencias. Los
modelos mostrados en los resultados se han centrado específicamente en resultados binarios, es decir,
extracción frente a no extracción, sin esbozar qué diente o conjunto de dientes necesita extracción.
Nuestros datos de expertos mostraron, y también se cree en general, que esta decisión binaria es una
decisión de primer orden, y requiere una pericia limitada en comparación con la decisión más
resuelta sobre qué diente, o conjunto de dientes, necesita ser extraído. Además, la decisión binaria
viene determinada por menos parámetros (apiñamiento o inclinación dental), un escenario mucho
más fácil, mientras que una decisión más resuelta requiere la determinación de parámetros que aún
están por estandarizar, lo que pone de relieve los retos que implica decidir entre muchos otros
resultados posibles.
Nuestra investigación no sólo se centra en esta decisión binaria, sino también en los otros trece
resultados posibles que ponen de relieve el diente o dientes concretos que requieren extracción,
creando un nuevo método basado en la inteligencia artificial para predecir un plan entre un gran
número de posibles planes de extracción (Figura 2) a partir de los 19 elementos característicos.
En segundo lugar, tras realizar una revisión exhaustiva de la bibliografía existente, limitamos
las características de diagnóstico a 19 predictores más relevantes. Los elementos del vector de
características adoptados pueden clasificarse a grandes rasgos en cinco categorías principales, a
saber, relación dentoesquelética sagital, relación dentoesquelética vertical, relación dental
transversal, relación de tejidos blandos y condiciones intraarco. Estudios similares [9-11] han
incluido muchas más características que no sólo han aumentado sus requisitos computacionales,
sino que también han añadido redundancia a su conjunto de datos. Además, se puede obtener
fácilmente un número reducido de características para cada paciente a partir de los registros estándar
sin utilizar enfoques de diagnóstico especiales. Un menor número de características también
significa que los expertos dedican menos tiempo a analizar los registros de cada paciente, con lo que
pueden analizar más muestras. Esto nos ayuda a evaluar la precisión de nuestro método en relación
con el desacuerdo entre expertos.
Pudimos explotar las diversas características utilizando múltiples modelos de aprendizaje
automático. Limitamos el número de características para facilitar la recopilación de datos y la
aplicación del método en la clínica. Pudimos extraer información adicional de las interacciones de
estas características y construir predictores no lineales para la regresión utilizando interacciones de segundo
Bioingeniería 2020, 7, 55 13 de 17
grado. Aunque el resultado fue un sobreajuste,
Bioingeniería 2020, 7, 55 14 de 17

La regularización fue capaz de generalizar el método y contrarrestar el sobreajuste. En general,


observamos que tanto el aprendizaje por conjuntos como la regresión ponderada son útiles en este
tipo de aplicaciones.
Una de las limitaciones de este estudio fue que los resultados del tratamiento se limitaron
únicamente a procedimientos ortodóncicos no quirúrgicos. Además, se excluyeron los modelos de
extracción atípicos, como la extracción de incisivos inferiores, las extracciones de segundos premolares
y las extracciones debidas a motivos patológicos, entre otros. Sin embargo, en el modelo optimizado
actual no se adoptaron los elementos que representaban tales características. Esto se debe a que el
presente estudio se centró principalmente en la optimización de protocolos de diagnóstico
ortodóncico rutinarios.
Por último, aunque es posible que el modelo actual aún no alcance una concordancia total con
los juicios humanos, cabe señalar que tiene la ventaja de que el sistema puede mejorar de forma
independiente su precisión de predicción añadiendo nuevos registros de pacientes como plantillas,
del mismo modo que los ortodoncistas podrían aumentar sus conocimientos y experiencia clínicos.
Esto significa que el modelo será más sólido clínicamente para tomar decisiones sobre el
tratamiento de cada paciente.
Hemos demostrado que nuestro conjunto limitado de características y nuestro algoritmo de
aprendizaje automático son capaces de predecir el procedimiento de extracción con una precisión
aproximadamente igual a la obtenida por diferentes expertos. El uso de un modelo clasificador
conjunto (bosque aleatorio [12]) nos permitió evitar el sobreajuste, como se ha confirmado en
muchos estudios anteriores [13-15]. Además, hemos demostrado que un conjunto de modelos más
simples supera a modelos más complejos, como una red neuronal para nuestro problema. El uso de
entrenamiento por lotes y abandonos puede ayudar al modelo de red neuronal a competir con el
modelo de bosque aleatorio.
Se desarrolló un clasificador de conjunto de bosque aleatorio que simula la toma de decisiones
de extracción/no extracción de dientes de ortodoncia y se confirmó que muestra un alto
rendimiento, dentro del rango del acuerdo entre expertos.
Las características utilizadas para llegar a la extracción o al plan de tratamiento en este estudio pueden
ser averiguadas por cualquier dentista que utilice este sistema en la clínica evaluando al paciente.
Nuestro objetivo futuro es obtener automáticamente estas características a partir de radiografías e
imágenes fotográficas. Tenemos previsto implementar el reconocimiento de objetos y la detección de
puntos de referencia en imágenes utilizadas habitualmente en la práctica clínica. Existen algunos trabajos en el
campo de la detección de puntos de referencia en radiografías cefalométricas [16,17], y otros aún
más amplios en la detección de imágenes biomédicas [18]. También se podrían explotar las
características internas [19-21] extraídas de los modelos de reconocimiento de imágenes para
predecir otros resultados diagnósticos.

Contribuciones de los autores: M.U., K. y Y.S. concibieron y diseñaron el estudio; A.C. recopiló los registros y actuó
como uno de los evaluadores; M.U. recopiló los datos y seleccionó las características de cada paciente; Y.S.
realizó el análisis computacional y de aprendizaje automático; Y.S., M.U. y K. redactaron el artículo. Todos los
autores han leído y aceptado la versión publicada del manuscrito.
Financiación: Financiación inicial del Centro de Salud de la Universidad de Connecticut (K).
Conflictos de intereses: Los autores y la Universidad de Connecticut han presentado la solicitud de patente
provisional estadounidense n.º 62/915.725 basada en este trabajo el 16 de octubre de 2019.

Referencias
1. Weintraub, J.A.; Vig, P.S.; Brown, C.; Kowalski, C.J. La prevalencia de las extracciones ortodóncicas. Am. J.
Orthod. Dentofac. Orthop. 1989, 96, 462-466. [CrossRef]
2. Burrow, S.J. Extraer o no extraer: una decisión de diagnóstico, no de marketing. Am. J. Orthod. 2008,
133, 341-342. [CrossRef] [PubMed]
3. Ribarevski, R.; Vig, P.; Vig, K.D.; Weyant, R.; O'Brien, K. Consistencia de las decisiones de extracción
ortodóncica.
Eur. J. Orthod. 1996, 18, 77-80. [CrossRef]
4. Dunbar, A.C.; Bearn, D.; McIntyre, G. The influence of using digital diagnostic information on orthodontic
treatment planning-A pilot study. J. Healthc. Eng. 2014, 5, 411-427. [CrossRef] [PubMed]
5. Baumrind, S. The decision to extract: Part I-Inter-clinician agreement. Am. J. Orthod. Dentofac. Orthop.
Bioingeniería 2020, 7, 55 15 de 17
1996, 109, 297-309. [CrossRef]
Bioingeniería 2020, 7, 55 16 de 17

6. Equipo central de R. R: A language and Environment for Statistical Computing. Fundación R para la
computación estadística Computing. Viena, Austria, 2018. Disponible en línea: https://www.R-project.org/
(consultado el 1 de mayo de 2020).
7. Venables, W.N.; Ripley, B.D. Modern Applied Statistics with S, 4ª ed.; Springer: Berlín/Heidelberg,
Alemania, 2002; ISBN 0-387-95457-0.
8. Liaw, A.; Wiener, M. Clasificación y regresión mediante randomForest. R News 2002, 2, 18-22.
9. Xie, X.; Wang, L.; Wang, A. Artificial neural network modeling for deciding if extractions are necessary prior
to orthodontic treatment. Angle Orthod. 2010, 80, 262-266. [CrossRef] [PubMed]
10. Jung, S.K.; Kim, T.W. Nuevo enfoque para el diagnóstico de extracciones con aprendizaje automático de
redes neuronales.
Am. J. Orthod. Dentofac. Orthop. 2016, 149, 127-133. [CrossRef] [PubMed]
11. Konstantonis, D.; Anthopoulou, C.; Makou, M. Extraxxtion decision and identification of treatment predictors
in class I malocclusions. Prog. Orthod. 2013, 14, 1-8. [CrossRef]
12. Ho, T.K. Bosques de decisión aleatorios. En Proceedings of the 3rd International Conference on Document
Analysis and Recognition, Montreal, QC, EE.UU., 14-16 de agosto de 1995.
13. Dietterich, T.G. Ensemble Methods in Machine Learning. En Multiple Classifier Systems. MCS 2000. Lecture
Notes in Computer Science; Springer: Berlín/Heidelberg, Alemania, 2020.
14. Breiman, L. Bosques aleatorios. Mach. Learn. 2001, 45, 5. [CrossRef].
15. Friedman, J.; Hastie, T.; Tibshirani, R. Regresión logística aditiva: A statistical view of boosting (con
discusión en y réplica de los autores). Ann. Stat. 2000, 28, 337-407. [CrossRef]
16. Nishimoto, S.; Sotsuka, Y.; Kawai, K.; Ishise, H.; Kakibuchi, M. Detección de hitos cefalométricos basada en
ordenador personal con aprendizaje profundo, utilizando cefalogramas en Internet. J. Craniofacial Surg. 2019,
30, 91-95. [CrossRef] [PubMed]
17. Lee, H.; Park, M.; Kim, J. Cephalometric landmark detection in dental x-ray images using convolutional
neural networks. SPIE Med. Imaging 2017. [CrossRef]
18. Ronneberger, O.; Fischer, P.; Brox, T. U-Net: Redes convolucionales para segmentación de imágenes
biomédicas. En Proceedings of the Medical Image Computing and Computer-Assisted Intervention-
MICCAI 2015, Múnich, Alemania, 5-9 de octubre de 2015.
19. Narayanan, B.N.; Hardie, R.C.; Kebede, T.M.; Sprague, M.J. Optimized feature selection-based clustering
approach for computer-aided detection of lung nodules in different modalities. Pattern Anal. Appl. 2019,
22, 559-571. [CrossRef]
20. Lambin, P.; Rios-Velazquez, E.; Leijenaar, R.; Carvalho, S.; Van Stiphout, R.G.; Granton, P.; Aerts, H.J.
Radiomics: Extracción de más información de imágenes médicas mediante el análisis avanzado de
características. Eur. J. Cancer 2012, 48, 441-446. [CrossRef] [PubMed]
21. Narayanan, B.N.; Hardie, R.C.; Kebede, T.M. Performance Analysis of Feature Selection Techniques for
Support Vector Machine and its Application for Lung Nodule Detection. En Actas de la conferencia
NAECON 2018-IEEE National Aerospace and Electronics Conference, Dayton, OH, Estados Unidos, 23-
26 de julio de 2018.
2020 por los autores. Licenciatario MDPI, Basilea, Suiza. Este artículo es de acceso
abierto
artículo distribuido bajo los términos y condiciones de la licencia Creative Commons
Attribution (CC BY) (http://creativecommons.org/licenses/by/4.0/).

También podría gustarte