Está en la página 1de 1

Método:

Sabiendo que el desarrollo del síndrome de Cancer de mama a nivel hereditario está ligado
principalmente a anomalías presentes en el gen BRCA1, se realizó un modelo que a partir de
secuencias de BRCA1 indica si aquella secuencia es de humano o de animal y si es susceptible a
padecer estas mutaciones que generan posteriormente el Cancer de mama. Se trabajó con
secuencias proteicas del gen BRCA1 tanto de humano como de animales, esto debido a que la
secuencia del gen completo no fue posible de conseguir y de igual forma ocurrió con secuencias de
ADN que estuvieran afectadas, por lo que se utilizaron secuencias proteicas facilitando el análisis.
Para la obtención de estas secuencias tanto sanas como enfermas, se utilizó el programa
Biopython y también se realizó la extracción de estas secuencias en varias bases de datos
permitiendo así tener una gran variedad y un total de treinta secuencias. Posteriormente se
realizó el alineamiento de estas secuencias en base a una secuencia de humano por medio de la
herramienta Clustal, de allí se extrajo el porcentaje de relación de todas las secuencias hacia la
secuencia con la que se alinearon. Se obtuvo la longitud de las secuencias para poder tenerlo
como ítem y así determinar si existe una mutación por desplazamiento o desfase, que es un tipo
de mutación causada por la inserción o deleción de un número de nucleótidos que no es múltiplo
de tres, pues debido a la naturaleza ternaria del código genético la inserción o deleción de un
número de nucleótidos no divisible por tres, puede cambiar el marco de lectura del gen, y por lo
tanto provoca una traducción completamente diferente a la original. Cabe resaltar que cuanto
antes aparezca la inserción o deleción en el gen, mayor es la alteración que sufre la proteína.
Según la longitud se colocó un número que indica la susceptibilidad de tener la mutación para de
esta forma lograr que el modelo prediga esta respuesta, este mismo proceso de asignar un
número se hizo para el tipo de secuencia si era de humano o de animal. Ya al tener los datos
necesarios estos fueron organizados en un data set para entrenar el modelo, se comenzó la
búsqueda del modelo que mejor predicción proporcionaba (las pruebas se realizaron con modelos
posteriormente explicados por el docente y modelos que se encontraban en la página Scikit
Learn), finalmente se usó el modelo Ridge Classifier, este modelo actúa bajo el método de
regresión de Ridge, lo que hace es que regulariza el modelo resultante imponiendo una
penalización al tamaño de los coeficientes de la relación lineal entre las características predictivas
y la variable objetivo(susceptibilidad). Se Estableció una red neuronal que puede leer e interpretar
la información y decir si la secuencia en estudio es de animal o de humano y si es susceptible a
tener las mutaciones que provocan el Cáncer de mama.

También podría gustarte