You are on page 1of 4

FILTRADO DE VARIANTES Y PROPUESTA DE TRATAMIENTO

MARIUS ALEXANDRU BOTOS, ISMAEL FERNÁNDEZ MIRANDA

MÁSTER EN BIOINFORMÁTICA

OBJETIVOS

El trabajo se desarrolla a partir de los datos obtenidos del ‘variant calling’ cuyos objetivos son:
1. Encontrar variantes patogénicas significativamente relacionadas con el perfil del paciente a
estudiar.
2. De las actuales bases de datos disponibles, desglosar la información de las distintas variantes
seleccionadas como significativamente relacionadas o causantes del perfil del paciente.
3. Sugerir posibles fármacos o terapias en base a esas alteraciones o variantes.

METODOLOGÍA

Para comenzar, con la información resultado del ‘variant calling’ realizado y contenida en un archivo
.vcf, se incorporó a la aplicación web PanDrugs. El resultado de esta aplicación fue una tabla formato
.tsv con las variantes y sus anotaciones.

Posteriormente, si tuviéramos una muestra control con su ‘variant calling’ en formato .vcf,
hubiéramos realizado una ordenación de las columnas de la tabla obtenida con PanDrugs
(https://www.pandrugs.org/#!/) y hubiéramos corrido un script Python que nos dará como resultado
otro tsv con los comentarios para poder observar si la variante se encuentra o no en la muestra
control. En este caso, no disponemos de muestra control, por lo que, la tabla con las variantes y las
anotaciones ordenadas fue el resultado para nuestro siguiente paso.

Con la tabla de variantes se realizó un filtrado ‘manual’ en el que se eliminaron:

- Las variantes cuya calidad era muy baja, no permitiéndonos usarlas de forma correcta, desde
el campo/columna comment.
- Los polimorfismos identificados con los campos/columnas de GMAF y GMAF_freq en las
frecuencias poblacionales superiores al 1%, además de los campos de gnomAD por encima del 1%.
- Por el campo de consecuencias pudimos eliminar todas aquellas que se trataban de
variantes en regiones intrónicas; downstream, uptream y sinónimas, observando antes que no
tuvieran alguna consecuencia patogénica significativa en el campo de información de ClinVar
(https://www.ncbi.nlm.nih.gov/clinvar/); las 5’ o 3’ UTR y las non coding. El resultado final fue una
tabla con 441 variantes de las cuales había que tener en cuenta, a la hora de categorizar cada una, si
era homopolímeros o no. Esto se debe a que la plataforma de secuenciación fue IonTorrent, muy
relacionada con la aparición de homopolímeros. Siendo importante tenerlos marcados para poder
estudiarlos visualmente a través de IGV y ser valorados más específicamente.
- Por la columna ​pfam nos podemos orientar para ver el perfil de conservación de las
secuencias de las proteínas a lo largo de la historia y su posible importancia a la hora de estar
alteradas en un dominio de interés.

Luego, se procedió a la selección de las variantes con una relación más significativa con la
enfermedad. Para ello, tuvimos en cuenta el vscore, o la importancia en relación a la enfermedad y
la información clínica de la base de datos COSMIC (https://cancer.sanger.ac.uk/cosmic) y ClinVar.
Estas bases de datos fueron también usadas para desglosar toda la información más relevante
acerca de las variantes seleccionadas, además de otras como GeneCards
(https://www.genecards.org/), VEP (The Ensembl Variant Effect Predictor;

1
https://www.ensembl.org/Tools/VEP), Genetics Home Reference (https://ghr.nlm.nih.gov/), Pfam
(https://pfam.xfam.org/) y TumorPortal (www.tumorportal.org).

Una vez obtenidas nuestras variantes de interés, procedemos a su análisis terapéutico con la
aplicación PanDrugs, en la que serán asociadas a los compuestos o fármacos conocidos y nos
proporcionarán su mejor relación a la hora de tratar dichas variantes.

Para estas variantes se obtuvo una lista de fármacos en la que encontramos múltiples candidatos.
Analizamos los compuestos capaces de interaccionar con nuestras variantes, presentando los
menores efectos adversos posibles y evitando las reacciones de resistencia. Si hay compuestos que
se estaban utilizando, se propusieron como opción principal o como alternativa a los compuestos en
fase experimental pero que tengan un alto score y cumplan el perfil para los genes seleccionados.

RESULTADOS Y DISCUSIÓN

Observamos que algunas variantes en genes como KRAS, TP53 y FGFR3 podían ser las de mayor
importancia para nuestro estudio, tanto por su vscore como por su información clínica en las bases
de datos de Cosmic y ClinVar principalmente (​Tabla 1​).

Tabla 1. ​Genes ordenados de mayor a menor por su vscore con información del cromosoma donde se localiza, la
mutación e información clínica de las bases de datos Cosmic y ClinVar.
Chr Mut Gene Cosmic ClinVar vscore
12 C/T KRAS COSM521:PATHOGENIC Pathogenic 0.7839
17 G/A TP53 COSM10656:PATHOGENIC Likely pathogenic 0.6171
12 C/- MDM2 - - 0.6108
12 A/- MDM2 - - 0.6108
15 C/- TCF12 - - 0.6106
15 G/- TCF12 - - 0.6106
1 -/G NTRK1 COSM4646886:NEUTRAL - 0.6041
3 G/- BCL6 - - 0.6031
1 C/- ARID1A - - 0.6030
1 -/C ARID1A - - 0.6030
1 C/- ARID1A - - 0.6030
1 G/- ARID1A - - 0.6030
1 G/- ARID1A - - 0.6030
10 -/C RET COSM3978494:NEUTRAL - 0.5995
10 G/- BLNK - - 0.5981
7 G/- EPHB4 - - 0.5922
12 T/- ERBB3 - - 0.5922
2 -/G BCL11A - - 0.5917
22 C/- EP300 - - 0.5912
19 C/- TCF3 - - 0.5910

2
19 -/G TCF3 - - 0.5910
4 G/A FGFR3 COSM6854620:PATHOGENIC - 0.5881

El gen KRAS da lugar a una proteína de la familia ras, que juega un rol importante en la regulación de
la proliferación celular. Este gen participa en algunos pathways como señalización RET y NFAT e
hipertrofia cardíaca. Mutaciones en este gen están ampliamente identificadas y relacionadas con
una amplia gama de enfermedades entre las que se encuentran varios tipos de cáncer.

El gen TP53 codifica para una proteína supresora de tumores con activación transcripcional, con
unión del DNA y dominios de oligomerización. Este gen regula diversos procesos de células
sometidas a estrés como arresto del ciclo celular, apoptosis, senescencia, reparación del DNA o
cambios del metabolismo. Las mutaciones en este gen están asociadas con una gran variedad de
tipos de cáncer humanos como cáncer adrenocortical, de colon y de páncreas y algunos más.

El gen FGFR3 siendo el responsable de muchas funciones celulares ya mencionadas en las que caben
destacar su presencia en la regulación de división y crecimiento celular, estableciendo el destino de
la célula. Encontrándose en gran cantidad de tejidos en los que su activación desencadena una
respuesta en la célula de maduración y desarrollo. Siendo el gen FGFR3 un representante muy
involucrado en el desarrollo y regulación celular. Alteraciones en este gen están asociadas a muchas
patologías como pueden ser procesos de angiogénesis, alteraciones en la formación de fibroblastos
relacionados directamente con enfermedades y alteraciones del esqueleto y especialmente
significante en las células epiteliales de la capa externa de la piel, estando muy presente una de las
isoformas en las células de la epidermis.

En los resultados de PanDrugs encontramos como una de las mejores opciones de tratamiento el
fármaco TRAMETINIB (​Fig. 1​) con un DScore de 0.9400. Este fármaco está aprobado y actua como un
inhibidor de MAP2K1, una proteína downstream de KRAS. Si la enfermedad presentase resistencia al
fármaco, tendríamos alternativas como el tratamiento con SELUMETINIB o ​PAZOPANIB​, con altos
scores.

3
Fig. 1.​ ​Fármacos propuestos con nuestras variantes de interés seleccionadas, obtenidos mediante PanDrugs.

En conclusión, se han encontrado tres variantes en los genes KRAS, TP53 y FGFR3 que categorizamos
como relacionadas o causantes del fenotipo del paciente. En base a estas variantes, determinamos
que el mejor fármaco para tratar al paciente es el TRAMETINIB.

You might also like