Está en la página 1de 12

Traducido del inglés al español - www.onlinedoctranslator.

com

Información suplementaria

Predicción de los productos químicos utilizados para la toma de decisiones para el crecimiento bacteriano

kazuha ashino1, Kenta Sugano2, Toshiyuki Amagasa2,3, Bei Wen Ying1,*

1Escuela de Graduados en Ciencias Ambientales y de la Vida, Universidad de Tsukuba, Ibaraki 305-8572, Japón

2Escuela de Posgrado en Ingeniería de Sistemas e Información, Universidad de Tsukuba, Ibaraki 305-8573, Japón
3Centro de Ciencias Computacionales, Universidad de Tsukuba, Ibaraki 305-8577, Japón
* Correspondencia: ying.beiwen.gf@u.tsukuba.ac.jp

Cifras complementarias
Figuras S1 pág.2

Figura S2 p.3
Figura S3 pág.4

Figura S4 p.5
Figura S5 pág.6

Figura S6 pág.7

Figura S7 p.8
Figura S8 p.9-10
Figura S9 p.11-12

1
A B C
1.0

Errores residuales medios


Paso 1. Extraiga el período exponencial (B, líneas azules) 10-1 0.8
0.6
Paso 2. Calcular las pendientes de dos registros vecinos 0.4
10-2
0.2
Paso 3. Eliminar el ruido y/o error de las pendientes
0.0
10-3

Nuevo

curva de crecimiento

Por defecto
Paso 4. Elija la pendiente máxima (B, línea roja),

Las tasas de crecimiento


y media con sus dos vertientes vecinas 0 5 10 15 20 25
Tiempo (h)

Figura S1 Programa mejorado para calcular la tasa de crecimiento con Python. A.Diagrama de flujo de procesamiento de datos para el cálculo de la tasa de crecimiento. Se ilustran cuatro pasos para

estimar las tasas de crecimiento a partir de las curvas de crecimiento.B.Una curva de crecimiento representativa. Las líneas verticales azules y rojas representan los límites de la fase exponencial y el punto

temporal de la tasa de crecimiento máxima, respectivamente.C.Comparación de variadas herramientas para evaluar la tasa de crecimiento. Los errores residuales medios, que representan la precisión de la

evaluación, se calcularon a partir de 60 muestras (curvas de crecimiento) con cuatro herramientas diferentes. "Nuevo" y "Predeterminado" indican el programa recientemente desarrollado en el presente

estudio y la herramienta instalada en el lector de placas, respectivamente. GrowthRate y Growthcurver son programas informados anteriormente.

2
A B C
1 40 0.6

con el paso 1

con el paso 3
0.4
0.5 20

Errores residuales medios


0.2

0 0 0
1 0 0.5 1 40 0 20 40 0.6 sin con
paso 1 paso 1

Sin paso 1

Sin paso 3
0.5 20 0.4

0.2
0 0
0 0.5 1 0 20 40 0
Manual Manual sin con
paso 1 paso 1

Figura S2 Evaluación mejorada de la tasa de crecimiento debido a la extracción del período exponencial.Se examinó si el paso 1 del procesamiento de datos (Fig. S1A) mejoró el cálculo de

la tasa de crecimiento. Las tasas de crecimiento calculadas con o sin el paso 1 (A, paneles superior e inferior, respectivamente) se trazan frente a las tasas de crecimiento calculadas

manualmente, que se consideraron los valores verdaderos. Las líneas rojas indican valores iguales. Como referencia, los puntos de tiempo para las tasas máximas de crecimiento (pendientes)

identificadas con o sin el paso 1 (B, paneles superior e inferior, respectivamente) se trazan contra los puntos de tiempo identificados manualmente. Los errores residuales medios de las tasas de

crecimiento y los puntos temporales (C, paneles superior e inferior, respectivamente) se calculan. La adición del paso 1 al programa redujo los errores en la evaluación del crecimiento.

3
A B C
0.8 40 0.4
0.6

Sin paso 3

Sin paso 5
0.4 20 0.2

Errores residuales medios


0.2
0 0
0
0.8 0 0,2 0,4 0,6 0,8 40 0 20 40
0.4 sin con
0.6

con el paso 3

con el paso 5
paso 3 paso 3
0.4 20
0.2 0.2

0 0
0 0,2 0,4 0,6 0,8 0 20 40 0
Manual Manual sin con
paso 3 paso 3

Figura S3 Evaluación mejorada de la tasa de crecimiento al eliminar el ruido.Se examinó si el paso 3 del procesamiento de datos (Fig. S1A) mejoró el cálculo de la tasa de

crecimiento. Las tasas de crecimiento calculadas con o sin el paso 3 (A, paneles superior e inferior, respectivamente) se trazan frente a las tasas de crecimiento calculadas

manualmente, que se consideraron los valores verdaderos. Las líneas rojas indican valores iguales. Como referencia, los puntos temporales de las tasas máximas de crecimiento

(pendientes) identificadas con o sin el paso 3 (B, paneles superior e inferior, respectivamente) se trazan contra los puntos de tiempo identificados manualmente. Los errores

residuales medios de las tasas de crecimiento y los puntos temporales (C, paneles superior e inferior, respectivamente). La adición del paso 3 al programa redujo los errores en la

evaluación del crecimiento.

4
Tasa de crecimiento, C225, mse=0,03

Crecimiento rápido Crecimiento lento

SO42-(mM)<=2.534

SO42-(mM)<=-0.3256

SO42-(mM)<=2.1088

4] ≤ 0,6 mM
[NUEVA HAMPSHIRE+ 0,6 mM < [NH+4] ≤ 282,8 mM 63,2 mM < [NH+4] ≤ 282,8 mM 4] > 632,4 mM
[NUEVA HAMPSHIRE+

[mg2+]≤0,1 mM [mg2+] ≤ 0,003 mM 0,1 mM < [mg2+] ≤ 22,4 mM


[Glucosa] ≤ 63,2 mM

Figura S4 Árbol de decisión para la tasa de crecimiento.El conjunto de datos para C225 se aplicó al aprendizaje del árbol de decisiones para predecir la tasa de crecimiento. Se muestra el

árbol resultante con una profundidad máxima de cuatro, y su precisión se indica con validación cruzada (mse). Los químicos predichos como elementos de decisión en la tasa de crecimiento

aparecen en el árbol. Naranja y azul ilustran las ramas de rápido y lento crecimiento, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala

logarítmica para la bifurcación, el valor de la validación cruzada para esta selección, el número de datos utilizados para esta selección y la tasa media de crecimiento de los datos utilizados para

esta selección se resumen en el cuadrados, de arriba hacia abajo. Los cuadrados involucrados en los caminos de las mejores y peores combinaciones químicas para el crecimiento están

resaltados con líneas anaranjadas y azules en negrita, respectivamente. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisión. Las barras de dos

colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las combinaciones químicas previstas para causar

un crecimiento rápido o nulo se resumen en los cuadrados grandes, en los que se muestran los rangos de las concentraciones químicas en escalas lineales.
5
Densidad de población, C225, mse=0,01

Baja densidad Alta densidad

NH4+(mM)<=1.801

SO42-(mM)<=2.5106

[Fe2+]≤1,0 μM [Fe2+]≤1,0 µM [Mg [Fe2+] > 1,0 μM


[mg2+] ≤ 22,4 mM 2+] > 22,4 mM [NH4] ] ≤ 63,2 mM
4
[NUEVA HAMPSHIRE+

[NH+4] > 632,4 mM ≤63,2+ mM [Histidina] ≈ 0 mM


[Glucosa]≤6,3 mm [Leucina] ≈ 0 mM

Figura S5 Árbol de decisión de la densidad saturada.El conjunto de datos C225 se aplicó al aprendizaje del árbol de decisión para predecir la densidad de población saturada. Se muestran los

árboles resultantes con una profundidad máxima de cuatro, y su precisión se indica con validación cruzada (mse). En el árbol aparecen las sustancias químicas previstas como elementos de

decisión para la densidad saturada. Naranja y azul ilustran las ramas de alta y baja densidad, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala

logarítmica para la bifurcación, el valor de la validación cruzada de esta selección, el número de datos utilizados para esta selección y la densidad saturada media de los datos utilizados para

esta selección se resumen en el cuadrados, de arriba hacia abajo. Los cuadrados involucrados en los caminos de las mejores y peores combinaciones químicas para la densidad de población

están resaltados con líneas gruesas en naranja y azul, respectivamente. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisión. Las barras de dos

colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las combinaciones químicas predichas para

causar densidad alta o cero se resumen en los cuadrados grandes, para los cuales los rangos de concentraciones químicas se muestran en las escalas lineales.

6
A C
Datos=1336, C=225, N=3~6

NUEVA HAMPSHIRE+

histidina
tiamina
Glucosa

leucina
Eliminar los datos de crecimiento irregular entre

ENTONCES2+

magnesio2+

4-
Fe2+
4
las repeticiones bajo la misma condición

correos

N / A+
H+

cl-
k+
Datos=1268, C=225, N=3~6
Eliminar los datos de crecimiento que muestran una distribución Glucosa
bimodal de la tasa de crecimiento en la misma condición
4
NUEVA HAMPSHIRE+
Datos=1233, C=218, N=3~6
Elimine los datos de crecimiento que muestran una 4
ENTONCES2+

distribución bimodal de maxOD en la misma condición k+


Datos=1208, C=213, N=3~6 H+
Fe2+
tiamina
B
registro10[Concentración química]

magnesio2+

correos
4-

datos1208 N / A+

cl-
leucina
histidina

C213 0 1
NUEVA HAMPSHIRE+

H+

magnesio2+

N / A+
Fe2+

4-
k+

histidina
cl-
ENTONCES2+

correos
Glucosa

leucina
4

|corr.|
tiamina
4

Figura S6 Distribución de datos y combinaciones químicas de los conjuntos de datos procesados. A.Diagrama de flujo del refinamiento de datos. Los datos, C y N representan los números

de las curvas de crecimiento individuales adquiridas en el ensayo, las combinaciones probadas de los diez compuestos químicos y las réplicas biológicas por combinación, respectivamente. El

conjunto de datos resaltado en naranja fue el conjunto de datos purificados que se usó en los siguientes análisis.B.Distribuciones de datos en el nivel químico único. Se indican un total de 13

productos químicos, que se engloban dentro de los diez compuestos. Las distribuciones de datos a niveles químicos individuales se muestran como barras de colores. Las concentraciones

probadas de estos 13 productos químicos se muestran en negro, dentro de las barras de distribución correspondientes. Esos puntos condensados aparecen como líneas negras. Los paneles

superior e inferior indican las distribuciones de 1208 curvas de crecimiento individuales y las 213 combinaciones, respectivamente.C.Relaciones entre los cambios de concentración de 13

sustancias químicas individuales. La matriz representa las correlaciones de los cambios en las concentraciones de dos sustancias químicas cualesquiera. La gradación de naranja claro a azul

oscuro indica los coeficientes de correlación de menor a mayor.


7
A
datos1208
C213

Tasa de crecimiento (h-1) población saturada,


sobredosis600(au)
B

datos1208
C213

Tasa de crecimiento (h-1)

Figura S7 Tasas de crecimiento y densidades de población saturadas de los conjuntos de datos procesados. A.Histogramas de la tasa de crecimiento y la densidad saturada. Los paneles

izquierdo y derecho muestran los histogramas de la tasa de crecimiento y la densidad saturada, respectivamente.B.Relación entre la tasa de crecimiento y la densidad saturada. Los coeficientes

de correlación de rango de Spearman de Data1208 y C213 son 0,33 (pag=5e-33) y 0,61 (pag=7e-23), respectivamente. Los conjuntos de datos Data1208 y C213 se indican en gris y bronce,

respectivamente.

8
Crecimiento rápido Crecimiento lento
Tasa de crecimiento, Data1208, mse=0.03

NH4+(mM)<=-0.199

SO42-(mM)<=1.9771
Tasa de crecimiento, C213, mse=0,03

NH4+(mM)<=-0.199

SO42-(mM)<=1.9771
Figura S8 Árbol de decisión de la tasa de crecimiento predicha utilizando los conjuntos de datos limpios.Los conjuntos de datos purificados Data1208 y C213 (paneles superior e inferior,

respectivamente) se aplicaron al aprendizaje del árbol de decisiones para predecir la tasa de crecimiento. Se muestran los árboles resultantes con una profundidad máxima de cuatro, y la

precisión se indica con validación cruzada (mse). Las sustancias químicas que se prevé que serán los elementos de decisión para la tasa de crecimiento aparecen en el árbol. Naranja y azul

ilustran las ramas de rápido y lento crecimiento, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala logarítmica para la bifurcación, el valor de la

validación cruzada de esta selección, el número de datos utilizados para esta selección y la tasa media de crecimiento de los datos utilizados para esta selección se resumen en el cuadrados, de

arriba hacia abajo. Los cuadrados involucrados en los caminos dirigidos hacia un crecimiento rápido se resaltan con líneas gruesas en naranja y verde, y aquellos con crecimiento cero están en

azul. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisiones. Las barras de dos colores al lado de los recuadros indican las frecuencias de las

alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Los árboles de decisión eran muy idénticos a los adquiridos con los conjuntos de datos ruidosos (Data1336,

C225). Se determinó recientemente un camino alternativo para un crecimiento rápido (resaltado en verde).

10
Baja densidad Alta densidad
Densidad de población, Data1208, mse=0.01

NH4+(mM)<=1.801

SO42-(mM)<=2.5106 NH4+(mM)<=1.801 Tiamina (μM) <= 0.6761

tia ine(μM)<=-0.8913
metro

H+(mM)<=2.1415
Densidad de población, C213, mse=0,01

SO42-(mM)<=1.8483

SO42-(mM)<=2.5106 NH4+(mM)<=1.801 Tiamina (μM) <= 0.6761

SO42-(mM)>1.2

H+(mM)<=2.1415

11
Figura S9 Árbol de decisión de la densidad saturada predicha con los conjuntos de datos limpios.Los conjuntos de datos purificados Data1208 y C213 (los paneles superior e inferior, respectivamente) se aplicaron al aprendizaje del árbol de decisiones para predecir la

densidad de población saturada. Se muestran los árboles resultantes con una profundidad máxima de cuatro, y la precisión se indica con validación cruzada (mse). En el árbol aparecen las sustancias químicas previstas como elementos de decisión para la densidad saturada.

Naranja y azul ilustran las ramas de alta y baja densidad, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala logarítmica para la bifurcación, el valor de la validación cruzada para esta selección, el número de datos utilizados

para esta selección y la densidad saturada media de los datos utilizados para esta selección se resumen en el cuadrados, de arriba hacia abajo. Los cuadrados involucrados en los caminos dirigidos hacia la alta densidad están resaltados con líneas gruesas en naranja y verde,

y los que se mueven hacia la densidad cero están en azul. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisiones. Las barras de dos colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos

niveles, revelando la estabilidad del árbol/predicción. Las ramas de baja densidad eran muy idénticas a las basadas en los conjuntos de datos ruidosos (Data1336, C225). Se determinó recientemente un camino alternativo para la densidad más alta (resaltado en verde). Las

barras de dos colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las ramas de baja densidad eran muy idénticas a las basadas en los conjuntos de datos ruidosos (Data1336, C225).

Se determinó recientemente un camino alternativo para la densidad más alta (resaltado en verde). Las barras de dos colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las ramas de

baja densidad eran muy idénticas a las basadas en los conjuntos de datos ruidosos (Data1336, C225). Se determinó recientemente un camino alternativo para la densidad más alta (resaltado en verde).

12

También podría gustarte