Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
APLICADA AL
LABORATORIO
INTRODUCCIÓN AL ANÁLISIS
MULTIVARIADO
JOHNNATAN GIRALDO
Introducción Análisis multivariado
¿Datos: univariantes vs multivariantes?
Univariantes: 1 muestra = una variable a la vez Multivariantes: 1 muestra = múltiples variables a la vez
Realidad
Univariante Multivariante
Conplejidad
Habitualmente
Por qué la banda ancha no te hará más rico [Internet]. [cited 2021 May 19]. Available from: https://blog.cnmc.es/2013/10/30/por-que-la-banda-ancha-no-te-hara-mas-rico/
La correlación entre los resultados de las variables X, Y se da cuando se observa una tendencia de los valores de X, Y los cuales cambian sus valores al mismo tiempo.
La causalidad aparece cuando los cambios en una variable afectan los resultados de otra.
Por qué la banda ancha no te hará más rico [Internet]. [cited 2021 May 19]. Available from: https://blog.cnmc.es/2013/10/30/por-que-la-banda-ancha-no-te-hara-mas-rico/
La correlación entre los resultados de las variables X, Y se da cuando se observa una tendencia de los valores de X, Y los cuales cambian sus valores al mismo tiempo.
La causalidad aparece cuando los cambios en una variable afectan los resultados de otra.
Por qué la banda ancha no te hará más rico [Internet]. [cited 2021 May 19]. Available from: https://blog.cnmc.es/2013/10/30/por-que-la-banda-ancha-no-te-hara-mas-rico/
Introducción Análisis multivariado
Medidas experimentales: orden de los datos
Mediciones univariantes
LC-MS system for clinical diagnostics announced by SCIEX | Spectroscopy Europe/World [Internet]. [cited 2021 May 20]. Available from:
https://www.spectroscopyeurope.com/product/lc-ms-system-clinical-diagnostics-announced-sciex
Mediciones multivariantes
[Contaminante]n
Barofsky DF. Mass spectrometric analyses in agriculture and natural product research. Brazilian J Phys [Internet]. 1999 Sep [cited 2021 May 21];29(3):432–9. Available
from: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-97331999000300006&lng=en&nrm=iso&tlng=en
Introducción Análisis multivariado
Mediciones multivariantes Medidas experimentales: orden de los datos
[Contaminante]n
Barofsky DF. Mass spectrometric analyses in agriculture and natural product research. Brazilian J Phys [Internet]. 1999 Sep [cited 2021 May 21];29(3):432–9. Available
from: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-97331999000300006&lng=en&nrm=iso&tlng=en
Número de muestras M1 V
M2
M3
M4
.
.
. Matriz de datos
Contiene la
Mn información química
N
Señales 2D
Ø Fluorescencia
Ø RMN
[Contaminante]n
Stefanakis D, Philippidis A, Sygellou L, Filippidis G, Ghanotakis D, Anglos D. Synthesis of fluorescent carbon dots by a microwave heating process: structural
characterization and cell imaging applications. J Nanoparticle Res. 2014 Oct 1;16(10).
Múltiples muestras:
Ø Análisis multivariante
Es un cubo de datos
Barofsky DF. Mass spectrometric analyses in agriculture and natural product research. Brazilian J Phys [Internet]. 1999 Sep [cited 2021 May 21];29(3):432–9. Available
Ø Cubo
from: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-97331999000300006&lng=en&nrm=iso&tlng=en
Introducción Análisis multivariado
Medidas experimentales: orden de los datos (resumen)
pH
Infusión directa m/z
Intensidad a un solo valor de m/z
Primer tr
Valores m/z
Muestras
Muestras
Dataset Muestras
Primer tr
Tiempos de retención
Barofs DF. Mass spectrometric analyses in agriculture and natural product research. Brazilian J Phys [Internet]. 1999 Sep [cited 2021 May 21];29(3):432–9. Available
Barofsky
from
from: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-97331999000300006&lng=en&nrm=iso&tlng=en
Introducción Análisis multivariado
Mediciones multivariantes Medidas experimentales: orden de los datos
Señales 2D
Ø Fluorescencia
Ø RMN
Barofs DF. Mass spectrometric analyses in agriculture and natural product research. Brazilian J Phys [Internet]. 1999 Sep [cited 2021 May 21];29(3):432–9. Available
Barofsky
from
from: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-97331999000300006&lng=en&nrm=iso&tlng=en
Muestras
Muestras
Muestras
Muestras peces
Muestras sedimentos
Estos conjuntos de datos se caracterizan por su gran variabilidad procedente de diferentes fuentes
Valores missing
Ø Valores desconocidos que producen vacíos en las matrices de datos.
Ø Porcentaje, distribución, agrupaciones?.
Ø Solución: estimación por imputación PCA .
Valores por debajo del LOD (< LOD)
Ø Compuestos detectados pero con resultados no fiables.
Ø Porcentaje, distribución, agrupaciones?
Ø Solución: eliminar, valores experimentales, LOD/2 (LOD no se recomienda)
Valores missing
Ø Valores desconocidos que producen vacíos en las matrices de datos.
Ø Porcentaje, distribución, agrupaciones?.
Ø Solución: estimación por imputación PCA .
Valores por debajo del LOD (< LOD)
Ø Compuestos detectados pero con resultados no fiables.
Ø Porcentaje, distribución, agrupaciones?
Ø Solución: eliminar, valores experimentales, LOD/2 (LOD no se recomienda)
Introducción Análisis multivariado
Datos perdidos (missing)
Valores missing
Ø Valores desconocidos que producen vacíos en las matrices de datos.
Ø Porcentaje, distribución, agrupaciones?.
Ø Solución: estimación por imputación PCA .
Valores por debajo del LOD (< LOD)
Ø Compuestos detectados pero con resultados no fiables.
Ø Porcentaje, distribución, agrupaciones?
Ø Solución: eliminar, valores experimentales, LOD/2 (LOD no se recomienda)
Valores missing
Ø Valores desconocidos que producen vacíos en las matrices de datos.
Ø Porcentaje, distribución, agrupaciones?.
Ø Solución: estimación por imputación PCA .
Valores por debajo del LOD (< LOD)
Ø Compuestos detectados pero con resultados no fiables.
Ø Porcentaje, distribución, agrupaciones?
Ø Solución: eliminar, valores experimentales, LOD/2 (LOD no se recomienda)
Introducción Análisis multivariado
Datos perdidos (missing)
Valores missing
Ø Valores desconocidos que producen vacíos en las matrices de datos.
Ø Porcentaje, distribución, agrupaciones?.
Ø Solución: estimación por imputación PCA .
Valores por debajo del LOD (< LOD)
Ø Compuestos detectados pero con resultados no fiables.
Ø Porcentaje, distribución, agrupaciones?
Ø Solución: eliminar, valores experimentales, LOD/2 (LOD no se recomienda)
ü No se tiene un valor para una determinada variable Se pueden distinguir dos casos:
en una muestra 1. Valores missing
2. Valores por debajo del LOD
ü Es de gran importancia en el análisis de datos
complejos, por ejemplo en datos ambientales
ü No se tiene un valor para una determinada variable Se pueden distinguir dos casos:
en una muestra 1. Valores missing
2. Valores por debajo del LOD
ü Es de gran importancia en el análisis de datos
complejos, por ejemplo en datos ambientales
q Análisis estadístico de los datos adquiridos para más de una variable (respuesta).
q Análisis simultaneo de todas las variables medidas.
q Estas variables pueden estar correlacionadas entre ellas.
q Se tiene en cuenta la dependencia entre las variables
Introducción Análisis multivariado
Análisis de datos multivariantes: aproximaciones
Aproximación univariante
Análisis multivariante
Clasificación Clustering
Discretas
Regresión/calibración Reducción de
dimensionalidad
Continuas
!! Less is more !!
Introducción Análisis multivariado
Visualización de los datos
q La simplicidad se puede conseguir dependiendo del estilo seleccionado
ü Efectos 3D
ü Efectos de color para decoración
ü Lineas de cuadricula
ü Ejes
ü Decimales
ü Tipo y tamaño de fuente Complejidad de los datos ¿Qué grafico es mas fácil de entender?
!! Less is more !!