Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
Información suplementaria
Predicción de los productos químicos utilizados para la toma de decisiones para el crecimiento bacteriano
1Escuela de Graduados en Ciencias Ambientales y de la Vida, Universidad de Tsukuba, Ibaraki 305-8572, Japón
2Escuela de Posgrado en Ingeniería de Sistemas e Información, Universidad de Tsukuba, Ibaraki 305-8573, Japón
3Centro de Ciencias Computacionales, Universidad de Tsukuba, Ibaraki 305-8577, Japón
* Correspondencia: ying.beiwen.gf@u.tsukuba.ac.jp
Cifras complementarias
Figuras S1 pág.2
Figura S2 p.3
Figura S3 pág.4
Figura S4 p.5
Figura S5 pág.6
Figura S6 pág.7
Figura S7 p.8
Figura S8 p.9-10
Figura S9 p.11-12
1
A B C
1.0
Nuevo
curva de crecimiento
Por defecto
Paso 4. Elija la pendiente máxima (B, línea roja),
Figura S1 Programa mejorado para calcular la tasa de crecimiento con Python. A.Diagrama de flujo de procesamiento de datos para el cálculo de la tasa de crecimiento. Se ilustran cuatro pasos para
estimar las tasas de crecimiento a partir de las curvas de crecimiento.B.Una curva de crecimiento representativa. Las líneas verticales azules y rojas representan los límites de la fase exponencial y el punto
temporal de la tasa de crecimiento máxima, respectivamente.C.Comparación de variadas herramientas para evaluar la tasa de crecimiento. Los errores residuales medios, que representan la precisión de la
evaluación, se calcularon a partir de 60 muestras (curvas de crecimiento) con cuatro herramientas diferentes. "Nuevo" y "Predeterminado" indican el programa recientemente desarrollado en el presente
estudio y la herramienta instalada en el lector de placas, respectivamente. GrowthRate y Growthcurver son programas informados anteriormente.
2
A B C
1 40 0.6
con el paso 1
con el paso 3
0.4
0.5 20
0 0 0
1 0 0.5 1 40 0 20 40 0.6 sin con
paso 1 paso 1
Sin paso 1
Sin paso 3
0.5 20 0.4
0.2
0 0
0 0.5 1 0 20 40 0
Manual Manual sin con
paso 1 paso 1
Figura S2 Evaluación mejorada de la tasa de crecimiento debido a la extracción del período exponencial.Se examinó si el paso 1 del procesamiento de datos (Fig. S1A) mejoró el cálculo de
la tasa de crecimiento. Las tasas de crecimiento calculadas con o sin el paso 1 (A, paneles superior e inferior, respectivamente) se trazan frente a las tasas de crecimiento calculadas
manualmente, que se consideraron los valores verdaderos. Las líneas rojas indican valores iguales. Como referencia, los puntos de tiempo para las tasas máximas de crecimiento (pendientes)
identificadas con o sin el paso 1 (B, paneles superior e inferior, respectivamente) se trazan contra los puntos de tiempo identificados manualmente. Los errores residuales medios de las tasas de
crecimiento y los puntos temporales (C, paneles superior e inferior, respectivamente) se calculan. La adición del paso 1 al programa redujo los errores en la evaluación del crecimiento.
3
A B C
0.8 40 0.4
0.6
Sin paso 3
Sin paso 5
0.4 20 0.2
con el paso 3
con el paso 5
paso 3 paso 3
0.4 20
0.2 0.2
0 0
0 0,2 0,4 0,6 0,8 0 20 40 0
Manual Manual sin con
paso 3 paso 3
Figura S3 Evaluación mejorada de la tasa de crecimiento al eliminar el ruido.Se examinó si el paso 3 del procesamiento de datos (Fig. S1A) mejoró el cálculo de la tasa de
crecimiento. Las tasas de crecimiento calculadas con o sin el paso 3 (A, paneles superior e inferior, respectivamente) se trazan frente a las tasas de crecimiento calculadas
manualmente, que se consideraron los valores verdaderos. Las líneas rojas indican valores iguales. Como referencia, los puntos temporales de las tasas máximas de crecimiento
(pendientes) identificadas con o sin el paso 3 (B, paneles superior e inferior, respectivamente) se trazan contra los puntos de tiempo identificados manualmente. Los errores
residuales medios de las tasas de crecimiento y los puntos temporales (C, paneles superior e inferior, respectivamente). La adición del paso 3 al programa redujo los errores en la
4
Tasa de crecimiento, C225, mse=0,03
SO42-(mM)<=2.534
SO42-(mM)<=-0.3256
SO42-(mM)<=2.1088
4] ≤ 0,6 mM
[NUEVA HAMPSHIRE+ 0,6 mM < [NH+4] ≤ 282,8 mM 63,2 mM < [NH+4] ≤ 282,8 mM 4] > 632,4 mM
[NUEVA HAMPSHIRE+
Figura S4 Árbol de decisión para la tasa de crecimiento.El conjunto de datos para C225 se aplicó al aprendizaje del árbol de decisiones para predecir la tasa de crecimiento. Se muestra el
árbol resultante con una profundidad máxima de cuatro, y su precisión se indica con validación cruzada (mse). Los químicos predichos como elementos de decisión en la tasa de crecimiento
aparecen en el árbol. Naranja y azul ilustran las ramas de rápido y lento crecimiento, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala
logarítmica para la bifurcación, el valor de la validación cruzada para esta selección, el número de datos utilizados para esta selección y la tasa media de crecimiento de los datos utilizados para
esta selección se resumen en el cuadrados, de arriba hacia abajo. Los cuadrados involucrados en los caminos de las mejores y peores combinaciones químicas para el crecimiento están
resaltados con líneas anaranjadas y azules en negrita, respectivamente. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisión. Las barras de dos
colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las combinaciones químicas previstas para causar
un crecimiento rápido o nulo se resumen en los cuadrados grandes, en los que se muestran los rangos de las concentraciones químicas en escalas lineales.
5
Densidad de población, C225, mse=0,01
NH4+(mM)<=1.801
SO42-(mM)<=2.5106
Figura S5 Árbol de decisión de la densidad saturada.El conjunto de datos C225 se aplicó al aprendizaje del árbol de decisión para predecir la densidad de población saturada. Se muestran los
árboles resultantes con una profundidad máxima de cuatro, y su precisión se indica con validación cruzada (mse). En el árbol aparecen las sustancias químicas previstas como elementos de
decisión para la densidad saturada. Naranja y azul ilustran las ramas de alta y baja densidad, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala
logarítmica para la bifurcación, el valor de la validación cruzada de esta selección, el número de datos utilizados para esta selección y la densidad saturada media de los datos utilizados para
esta selección se resumen en el cuadrados, de arriba hacia abajo. Los cuadrados involucrados en los caminos de las mejores y peores combinaciones químicas para la densidad de población
están resaltados con líneas gruesas en naranja y azul, respectivamente. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisión. Las barras de dos
colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las combinaciones químicas predichas para
causar densidad alta o cero se resumen en los cuadrados grandes, para los cuales los rangos de concentraciones químicas se muestran en las escalas lineales.
6
A C
Datos=1336, C=225, N=3~6
NUEVA HAMPSHIRE+
histidina
tiamina
Glucosa
leucina
Eliminar los datos de crecimiento irregular entre
ENTONCES2+
magnesio2+
4-
Fe2+
4
las repeticiones bajo la misma condición
correos
N / A+
H+
cl-
k+
Datos=1268, C=225, N=3~6
Eliminar los datos de crecimiento que muestran una distribución Glucosa
bimodal de la tasa de crecimiento en la misma condición
4
NUEVA HAMPSHIRE+
Datos=1233, C=218, N=3~6
Elimine los datos de crecimiento que muestran una 4
ENTONCES2+
magnesio2+
correos
4-
datos1208 N / A+
cl-
leucina
histidina
C213 0 1
NUEVA HAMPSHIRE+
H+
magnesio2+
N / A+
Fe2+
4-
k+
histidina
cl-
ENTONCES2+
correos
Glucosa
leucina
4
|corr.|
tiamina
4
Figura S6 Distribución de datos y combinaciones químicas de los conjuntos de datos procesados. A.Diagrama de flujo del refinamiento de datos. Los datos, C y N representan los números
de las curvas de crecimiento individuales adquiridas en el ensayo, las combinaciones probadas de los diez compuestos químicos y las réplicas biológicas por combinación, respectivamente. El
conjunto de datos resaltado en naranja fue el conjunto de datos purificados que se usó en los siguientes análisis.B.Distribuciones de datos en el nivel químico único. Se indican un total de 13
productos químicos, que se engloban dentro de los diez compuestos. Las distribuciones de datos a niveles químicos individuales se muestran como barras de colores. Las concentraciones
probadas de estos 13 productos químicos se muestran en negro, dentro de las barras de distribución correspondientes. Esos puntos condensados aparecen como líneas negras. Los paneles
superior e inferior indican las distribuciones de 1208 curvas de crecimiento individuales y las 213 combinaciones, respectivamente.C.Relaciones entre los cambios de concentración de 13
sustancias químicas individuales. La matriz representa las correlaciones de los cambios en las concentraciones de dos sustancias químicas cualesquiera. La gradación de naranja claro a azul
datos1208
C213
Figura S7 Tasas de crecimiento y densidades de población saturadas de los conjuntos de datos procesados. A.Histogramas de la tasa de crecimiento y la densidad saturada. Los paneles
izquierdo y derecho muestran los histogramas de la tasa de crecimiento y la densidad saturada, respectivamente.B.Relación entre la tasa de crecimiento y la densidad saturada. Los coeficientes
de correlación de rango de Spearman de Data1208 y C213 son 0,33 (pag=5e-33) y 0,61 (pag=7e-23), respectivamente. Los conjuntos de datos Data1208 y C213 se indican en gris y bronce,
respectivamente.
8
Crecimiento rápido Crecimiento lento
Tasa de crecimiento, Data1208, mse=0.03
NH4+(mM)<=-0.199
SO42-(mM)<=1.9771
Tasa de crecimiento, C213, mse=0,03
NH4+(mM)<=-0.199
SO42-(mM)<=1.9771
Figura S8 Árbol de decisión de la tasa de crecimiento predicha utilizando los conjuntos de datos limpios.Los conjuntos de datos purificados Data1208 y C213 (paneles superior e inferior,
respectivamente) se aplicaron al aprendizaje del árbol de decisiones para predecir la tasa de crecimiento. Se muestran los árboles resultantes con una profundidad máxima de cuatro, y la
precisión se indica con validación cruzada (mse). Las sustancias químicas que se prevé que serán los elementos de decisión para la tasa de crecimiento aparecen en el árbol. Naranja y azul
ilustran las ramas de rápido y lento crecimiento, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala logarítmica para la bifurcación, el valor de la
validación cruzada de esta selección, el número de datos utilizados para esta selección y la tasa media de crecimiento de los datos utilizados para esta selección se resumen en el cuadrados, de
arriba hacia abajo. Los cuadrados involucrados en los caminos dirigidos hacia un crecimiento rápido se resaltan con líneas gruesas en naranja y verde, y aquellos con crecimiento cero están en
azul. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisiones. Las barras de dos colores al lado de los recuadros indican las frecuencias de las
alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Los árboles de decisión eran muy idénticos a los adquiridos con los conjuntos de datos ruidosos (Data1336,
C225). Se determinó recientemente un camino alternativo para un crecimiento rápido (resaltado en verde).
10
Baja densidad Alta densidad
Densidad de población, Data1208, mse=0.01
NH4+(mM)<=1.801
tia ine(μM)<=-0.8913
metro
H+(mM)<=2.1415
Densidad de población, C213, mse=0,01
SO42-(mM)<=1.8483
SO42-(mM)>1.2
H+(mM)<=2.1415
11
Figura S9 Árbol de decisión de la densidad saturada predicha con los conjuntos de datos limpios.Los conjuntos de datos purificados Data1208 y C213 (los paneles superior e inferior, respectivamente) se aplicaron al aprendizaje del árbol de decisiones para predecir la
densidad de población saturada. Se muestran los árboles resultantes con una profundidad máxima de cuatro, y la precisión se indica con validación cruzada (mse). En el árbol aparecen las sustancias químicas previstas como elementos de decisión para la densidad saturada.
Naranja y azul ilustran las ramas de alta y baja densidad, respectivamente. El nombre de la sustancia química seleccionada y su concentración en una escala logarítmica para la bifurcación, el valor de la validación cruzada para esta selección, el número de datos utilizados
para esta selección y la densidad saturada media de los datos utilizados para esta selección se resumen en el cuadrados, de arriba hacia abajo. Los cuadrados involucrados en los caminos dirigidos hacia la alta densidad están resaltados con líneas gruesas en naranja y verde,
y los que se mueven hacia la densidad cero están en azul. Los cuadros grises representan los productos químicos alternativos previstos con el árbol de decisiones. Las barras de dos colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos
niveles, revelando la estabilidad del árbol/predicción. Las ramas de baja densidad eran muy idénticas a las basadas en los conjuntos de datos ruidosos (Data1336, C225). Se determinó recientemente un camino alternativo para la densidad más alta (resaltado en verde). Las
barras de dos colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las ramas de baja densidad eran muy idénticas a las basadas en los conjuntos de datos ruidosos (Data1336, C225).
Se determinó recientemente un camino alternativo para la densidad más alta (resaltado en verde). Las barras de dos colores al lado de los recuadros indican las frecuencias de las alternativas en los mismos niveles, revelando la estabilidad del árbol/predicción. Las ramas de
baja densidad eran muy idénticas a las basadas en los conjuntos de datos ruidosos (Data1336, C225). Se determinó recientemente un camino alternativo para la densidad más alta (resaltado en verde).
12