• WIGO | Newsletter
  • Posts
  • WIGO Expert - Rodrigo Guarischi e o Futuro da Medicina de Precisão

WIGO Expert - Rodrigo Guarischi e o Futuro da Medicina de Precisão

Nesta edição do WIGO Expert, Rodrigo mergulha no universo genético, discutindo um tema que gera empolgação em qualquer um, os Scores de Risco Poligênicos (PRS). Imagine o genoma como o grande Google da biologia, onde cada busca revela algo único sobre nós. Com o PRS, estamos começando a entender essas nuances genéticas, transformando um mar de dados em previsões de saúde mais precisas. Rodrigo ressalta que, embora ainda estejamos decifrando esta linguagem complexa e hoje a preços cada vez mais acessíveis, estamos aprendendo a traduzi-la corretamente para todos, independentemente da origem étnica. Ele nos leva a sonhar com um futuro onde essa tecnologia possa ser a chave mestra para a medicina personalizada, mas não sem antes navegar pelos debates da ética e da inclusão.

Quem é o Expert desta edição?

Rodrigo trabalha com bioinformática há mais de 15 anos e já atuou em pesquisas científicas inovadoras bem como no diagnóstico clínico em sua passagem pela maior rede de saúde integrada da América Latina, a DASA (Diagnósticos da América). Na DASA, foi responsável pela criação e liderança do departamento de bioinformática da DASA Genômica, atuando na validação/operação de múltiplos produtos estratégicos baseados em sequenciamento de DNA. Possui experiência técnica profunda nos temas: chamada de variantes de DNA, escores poligênicos, desenvolvimento/automação de pipeline de bioinformática, análise de expressão gênica por RNA-Seq, montagem e anotação de genoma procariótico, angiogênese e aprendizado de máquina. Sua formação acadêmica inclui graduação, mestrado e doutorado pela Universidade de São Paulo (USP) e pós-doutorado pela Universidade de Stanford, nos Estados Unidos.

Genômica em Transformação: Leitura, Riscos e o Futuro da Medicina de Precisão

I. O genoma é o nosso código fonte

 

Um genoma humano é feito de bases de DNA, as famosas letras: Adenina, Timina, Citosina e Guanina. Esse genoma é agrupado em blocos, os cromossomos, e temos 23 deles. Se você pudesse “colar” todos os cromossomos em sequência, um após o outro, chegaríamos em uma longa sequência de 3,2 bilhões de pares de base que estão presentes em cada uma de nossas trilhões de células que compõem o nosso corpo.

Todos nós temos 2 cópias do genoma, uma recebida da sua mãe e outra do seu pai. A similaridade entre elas é superior a 99,9%, mas elas não são idênticas!

O seu genoma está para a célula assim como um código fonte está para computadores. Esse conjunto de instruções são usado pelas suas células para determinar como cada uma delas vivem, crescem, e como elas interagem com outras células. E como um código de computador, permite que as células realizarem decisões de onde e como as coisas acontecem. Se houver erros nessas instruções, herdadas dos seus pais ou adquiridos ao longo da nossa vida (pela exposição ultravioleta, por exemplo), você pode ter câncer, entre muitas outras coisas.

Dentro do nosso genoma existem regiões especiais chamadas genes, neles há as instruções especialmente importantes para a fabricação de proteínas e outros componentes vitais para a célula. O genoma humano possui pouco mais de 22 mil genes espalhados por todos os 23 pares de cromossomos.

 

II. Conseguimos ler esse código fonte

Como você pode imaginar, ler 3,2 bilhões de pares de bases não é uma tarefa nada fácil, mas um grande projeto científico iniciado em 1990 e concluído em 2003 chamado “Human Genome Project” foi capaz de resolver esse quebra cabeça e montar o primeiro genoma humano ao custo de US$ 2,7 bilhões (equivalente a quase US$5 bilhões hoje em dia).

Felizmente, a tecnologia genética avançou a passos muito acelerados nas últimas décadas tornando o processo de geração de dados genéticos ordens de grandeza mais barato. Hoje, existem máquinas capazes de gerar dados suficientes para ler o genoma completo de um humano a um custo de cerca de USD 200,00, e esse número tende a cair ainda mais. Isso permitiu aos cientistas explorarem com cada vez mais clareza o genoma de milhares de indivíduos e entender como as pequenas diferenças observadas são responsáveis pelas mais diversas características humanas e doenças (Figura 1).

Figura 1: Redução do custo de geração de dados suficientes para ler um genoma humano completo desde a conclusão do “Human Genome Project” até os dias atuais. https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

 

O projeto genoma humano produziu uma sequência referência que ainda é utilizada para as pesquisas biomédicas. Quando sequenciamos um genoma completo de alguém e comparamos com essa referência, observamos, em média, 4,5 milhões de diferenças. É justamente esse 0,1% (4,5 milhões / 3,2 bilhões) que nos faz diferentes!

Explorando essas diferenças, ou “variantes” no jargão genômico, os cientistas e os profissionais de saúde conseguem explicar por que algo está acontecendo com alguém ou o que há altas chances de acontecer no futuro.

 

III. Características monogênicas e poligênicas e os Scores de Risco Poligênicos (PRS)

Alguns traços humanos têm, por natureza, a característica de serem monogênicas. Isso significa que a investigação de um gene, ou um pequeno conjunto de genes, buscando por uma variante ou um punhado delas é suficiente para explicar uma determinada pergunta biológica ou clínica. Esse é o processo que acontece dentro de laboratórios clínicos durante a investigação, por exemplo, das causas genéticas de uma doença rara. Um exemplo clássico de investigação genética para doença monogênica rara é no caso da fibrose cística. Entre os 22 mil genes humanos existe um localizado no cromossomo 7 que se chama CFTR. Ele é um gene muito importante para a condição fisiológica humana. Porém, dependendo da variante presente na região do gene CFTR e se acontecerem tanto na cópia paterna quanto na materna do genoma, o indivíduo desenvolverá uma doença grave chamada fibrose cística.

Entretanto, a investigação de um gene ou um conjunto pequeno de genes, não é suficiente para dar respostas precisas sobre características humanas mais complexas. Traços comuns como diabetes tipo 2, colesterol, pressão sanguínea, altura, inteligência, envelhecimento da pele, entre muitos outros são determinados por um conjunto de milhares ou centenas de milhares de variantes em nosso DNA ao longo de todo o genoma. Isso porque, essas características são poligênicas (do grego, “poly”, que significa “muitos” e “genos” que significa “origem” ou “tipo”). Observe que não estou me referindo exclusivamente a doenças, mas uma variedade de características humanas.

Entretanto, apesar de todas essas variantes estarem verdadeiramente associadas ao traço sendo estudado, individualmente, o efeito de cada uma é muito pequeno e a interpretação correta dessa informação somente acontecesse quando essas variantes são avaliadas em conjunto, e não de forma isolada. É como tentar adivinhar a figura de um quebra-cabeça de 10 mil peças sem a caixa. Para você verdadeiramente conseguir interpretar a figura, você precisará colocar as peças juntas antes.

O Score de Risco Poligênico ou Score Poligênico (no inglês, PRS ou PGS) nada mais é do que uma metodologia que os cientistas desenvolveram para conseguir resumir o risco genético de um indivíduo a partir de centenas ou milhares de variantes presentes em seu genoma de uma forma unificada, de uma forma global. Dependendo de quais e quantas variantes um individuo herdou de seus pais, ele terá mais chance de desenvolver uma determinada característica ou doença. Em outras palavras, o PRS é uma maneira de quantificar a nossa predisposição genética a uma característica sendo estudada.

IV. Como desenvolver um PRS?

O desenvolvimento de um PRS é complexo e envolve a participação de milhares de voluntários. Esses voluntários participam de grandes estudos científicos respondendo perguntas sobre histórico de doenças, dando acesso a resultados de exames, estilo de vida e muitos outros. Esses projetos, chamados biobancos, armazenam essas informações juntamente com a genética do indivíduo. Hoje no mundo existem alguns projetos de biobancos como Million Veteran Program (MVP), UK Biobank, FinnGen, All of US, e essa lista não para de crescer (Tabela 1).  

Tabela 1: Exemplo de alguns biobancos atualmente ativos no mundo.

A partir desse conjunto gigantesco de dados anonimizados, cientistas realizam muitos testes para tentar buscar e catalogar quais variantes (as peças do nosso quebra-cabeça) estão associadas a característica sendo estudada (Figura 2).

Figura 2: Gráfico conhecido como Manhattan Plot, representando vários locais significativamente associados a característica sendo estudada. Cada ponto representa uma variante, o eixo X representa a localização genômica e o eixo Y representa o nível de associação. Este exemplo foi retirado de um estudo que investiga a doença dos cálculos renais, portanto os picos indicam variantes genéticas que são encontradas com mais frequência em indivíduos com cálculos renais. Os nomes dos genes próximos às regiões identificadas são representados e associações conhecidas na literatura (preto) e novas (vermelho) são destacados (https://en.wikipedia.org/wiki/Genome-wide_association_study).

Partindo dessa informação de quais peças do quebra-cabeça são “mais importantes” para a característica estudada, estudos subsequentes realizam um ajuste fino atribuindo pesos individuais para cada uma delas. Atribuindo pesos relativos maiores quanto mais importantes forem tais regiões. O PRS é justamente esse algoritmo que contém a lista das variantes e seus respectivos pesos. Uma vez que o PRS é desenvolvido, ele é replicado em outros conjuntos de pessoas e é capaz de estimar um risco relativo de que aquela característica se manifeste em cada um desses indivíduos.

A demanda computacional para realizar esse tipo de pesquisa é altíssima. Apenas o sequenciamento completo do genoma de 500 mil participantes do projeto UK Biobank gerou 27,5 Petabytes de dados! Ou seja, seriam necessários 42.579.388 CDs para armazenar somente os dados brutos de uma parte de um projeto como esse, sem considerar seu processamento. Como você deve imaginar, esses projetos científicos de pesquisa genômica populacional tem como pilar central grandes supercomputadores e datacenters e esses projetos foram profundamente impulsionados pela disponibilização de serviços de computação em nuvem, pois tornam esse tipo de serviço muito mais acessível e escalável.

Hoje temos bons PRSs desenvolvidos para algumas áreas da medicina humana, como cardiologia, oncologia, endocrinologia, reumatologia e muitas outras áreas do conhecimento também estão entrando nessa onda dos PRS impulsionados pelo acesso facilitado a grandes biobancos com cada vez mais participantes, o que garante o poder estatístico necessário para tais descobertas. Esses grandes projetos científicos só foram possíveis graças a redução acelerada no custo do sequenciamento de DNA combinada com a disponibilidade de serviços de computação em nuvem.

 

V. Quais limitações e o que devemos esperar para o futuro?

Uma das grandes limitações que temos com PRS hoje é a portabilidade desses algoritmos para populações de outras etnias. Isso porque as variantes e seus pesos não replicam necessariamente bem entre indivíduos de outras ancestralidades. 

Isso é particularmente um problema pois a esmagadora maioria dos participantes de biobancos tem origem europeia. Essa falta de diversidade reflete em PRS com menor poder preditivo em populações de outras etnias. Hoje, tipicamente, os PRS desenvolvidos tem melhor poder preditivo em populações de origem europeia e perdem consideravelmente esse poder quando aplicados em populações de outra origem, particularmente a africana.

Figura 3: A percentagem de populações ancestrais incluídas em estudos gnômicos em grande escala é esmagadoramente europeia (https://www.genome.gov/Health/Genomics-and-Medicine/Polygenic-risk-scores).

Felizmente, os cientistas estão bem atentos a essa limitação e buscando ativamente aumentar a diversidade populacional em diversas dessas iniciativas científicas. O setor privado brasileiro também está atento e algumas empresas nacionais, como a gen-t, tem o objetivo de fomentar a pesquisa e desenvolvimento biomédico no país pelo aproveitamento da nossa diversidade e mistura genética.

PRSs ainda não são usados rotineiramente pelos profissionais de saúde porque não existem diretrizes para a prática e os pesquisadores ainda estão melhorando a forma como esses escores são gerados. No entanto, empresas privadas que atuam em genética para uso recreacional (por exemplo: Genera, 23andme e Ancestry) já começaram a gerar PRS para os seus consumidores e poderão algum dia servir como uma nova ferramenta importante para orientar as decisões em matéria de cuidados de saúde.

Enquanto isso, é importante também que regulamentações sejam criadas para definir os limites e responsabilidades de cada um dos atores envolvidos no processo a fim de evitar que essa ferramenta não seja desvirtuada, por exemplo, por planos de saúde a fim de identificar pacientes em alto risco de tratamentos de alto custo no futuro, negando cobertura e/ou exigindo valores abusivos pelo seguro.

O sucessivo barateamento dos custos de geração de dados genômicos é um caminho sem volta e devemos nos acostumar com a ideia de termos nosso genoma investigado, assim como qualquer outro exame laboratorial de triglicerídeos ou colesterol. Nesse contexto, o PRS é uma poderosa ferramenta e que evolui rapidamente à medida que mais dados são disponibilizados para pesquisa, porém, é importante lembrar que PRS serão sempre probabilidades, não certezas. Seu uso potencial é bastante amplo em humanos (e não humanos também), e isso representa uma oportunidade sem precedentes de promoção de saúde e ganhos econômicos, mas também postula riscos que devem ser cuidadosamente avaliados e mitigados para que o PRS não seja transformado em uma arma de discriminação genética. O bom uso dessa tecnologia representa uma oportunidade de inclusão em massa da população na era da medicina de precisão e prevenção, e é para esse futuro que devemos tentar caminhar.

Se você tiver alguma sugestão ou informação que acha que pode ser publicada nos envia um e-mail para [email protected]

Reply

or to participate.