Genoma de referência

Origem: Wikipédia, a enciclopédia livre.
A primeira impressão do genoma humano de referência apresentado como uma série de livros, exibida na Wellcome Collection, Londres (Reino Unido)

Um genoma de referência (também conhecido como conjunto de referência ) é um banco de dados digital de sequências de ácidos nucleicos (ADN ou DNA), reunido por cientistas como um exemplo representativo do conjunto de genes em um organismo individual idealizado de uma espécie. Como eles são reunidos a partir do sequenciamento de DNA de vários doadores individuais, os genomas de referência não representam com precisão o conjunto de genes de qualquer organismo individual. Em vez disso, uma referência fornece um mosaico haplóide de diferentes seqüências de DNA de cada doador. Existem genomas de referência para várias espécies de vírus, bactérias, fungos, plantas e animais .

Por exemplo, o genoma de referência humano, versão GRCh38, do Genome Reference Consortium é derivado de treze voluntários anônimos.[1]

À medida que o custo do sequenciamento de DNA diminui, e novas tecnologias de sequenciamento completo de genoma surgem, mais sequências de genoma continuam sendo geradas. Os genomas de referência são normalmente usados como um guia sobre o desenvolvimento de novos genomas, permitindo que sejam montados com muito mais rapidez e baixo custo do que o Projeto Genoma Humano inicial. A maioria das pessoas com todo o seu genoma sequenciado, como James D. Watson, teve seu genoma sequenciado dessa maneira.[2] Para grande parte de um genoma, a referência fornece uma boa aproximação do DNA de qualquer indivíduo. Mas em regiões com alta diversidade alélica, como o principal complexo de histocompatibilidade em humanos e as principais proteínas urinárias de camundongos, o genoma de referência pode diferir significativamente de outros indivíduos.[3][4][5] A comparação entre a referência (versão "build 36") e o genoma de Watson revelou 3,3 milhões de diferenças de polimorfismo de nucleotídeo único, e aproximadamente 1,4% de seu DNA não poderiam corresponder ao genoma de referência.[6][7] Para regiões onde se sabe que há variação em grande escala, conjuntos de loci alternativos são montados ao lado do locus de referência.

Os genomas de referência podem ser acessados on-line em vários locais, usando navegadores dedicados, como, por exemplo: o Ensembl ou ainda o UCSC Genome Browser .[8]

Genoma de mamíferos[editar | editar código-fonte]

Os genomas de referência para humanos e camundongos são mantidos e aprimorados pelo consórcio GRC (Genome Reference Consortium), um grupo de pouco menos de 20 cientistas, de vários institutos de pesquisa de genoma, incluindo o Instituto Europeu de Bioinformática, o Centro Nacional de Informações Biotecnológicas, o Instituto Sanger e McDonnell Genome Institute da Universidade de Washington em St. Louis . O GRC continua seu trabalho de aperfeiçoar os genomas de referência, construindo novos alinhamentos que contêm menos lacunas e corrigindo deturpações dos sequenciamentos anteriores.

O genoma de referência humano GRCh38 foi lançado no Genome Reference Consortium em 17 de dezembro de 2013.[9] Essa compilação continha cerca de 250 lacunas, enquanto a primeira versão tinha aproximadamente 150.000 lacunas.[1] A montagem do GRCh38 resolveu mais de 100 lacunas. O seqüenciamento de nanopore fechou 12 lacunas no conjunto de referência GRCh38, através do uso de leituras ultra-longas.[10]

O genoma de referência humano é derivado de treze voluntários anônimos, todos de Buffalo, Nova York (EUA). Os doadores foram recrutados por propaganda no The Buffalo News, no domingo, 23 de março de 1997. Os dez primeiros voluntários do sexo masculino e dez do sexo feminino foram convidados a marcar uma consulta com os conselheiros genéticos do projeto e a doar sangue, do qual o DNA foi extraído. Como resultado do sequenciamento das amostras de DNA, aproximadamente 80% do genoma de referência vieram de oito pessoas e um homem designado "RP11", que responde por 66% do total. O sistema do grupo sanguíneo ABO difere entre os humanos, mas o genoma de referência humano contém apenas um alelo O, embora os outros sejam anotados ).[11][1][12][13][6]

Existem limitações no genoma de referência humano devido ao fato de ser uma sequência distinta "única". E, por causa disso, é especificamente nomeado como uma "referência". O principal objetivo pelo qual ele é utilizado é como um índice, ou um localizador, para características genéticas. O 1000 Genomes Project está criando um banco de dados para fornecer informações sobre as variações nos genomas na população humana.[14]

As versões recentes de genoma humano são as seguintes: [15]

Nome da versão Data de lançamento Versão equivalente do UCSC
GRCh38 Dez 2013 hg38
GRCh37 Fev 2009 hg19
NCBI Build 36.1 Mar 2006 hg18
NCBI Build 35 Maio de 2004 hg17
NCBI Build 34 Jul 2003 hg16

Genoma de referência do camundongo[editar | editar código-fonte]

As versões recentes de genoma de camundongos são as seguintes: [15]

Nome da versão Data de lançamento Versão equivalente do UCSC
GRCm38 Dez 2011 mm10
NCBI Build 37 Jul 2007 mm9
NCBI Build 36 Fev 2006 mm8
NCBI Build 35 Ago 2005 mm7
NCBI Build 34 Mar 2005 mm6

Referências[editar | editar código-fonte]

  1. a b c Editorial. «E pluribus unum». Nature Methods. 7: 910–918. PMC 415373Acessível livremente. PMID 331. doi:10.1038/nmeth0510-331 
  2. The exception to this is J. Craig Venter whose DNA was sequenced and assembled using shotgun sequencing methods.
  3. MHC Sequencing Consortium (1999). «Complete sequence and gene map of a human major histocompatibility complex». Nature. 401: 921–923. Bibcode:1999Natur.401..921T. PMID 10553908. doi:10.1038/44853 
  4. Logan DW, Marton TF, Stowers L (2008). Vosshall, ed. «Species specificity in major urinary proteins by parallel evolution». PLoS ONE. 3: e3280. Bibcode:2008PLoSO...3.3280L. PMC 2533699Acessível livremente. PMID 18815613. doi:10.1371/journal.pone.0003280 
  5. Urinary Lipocalins in Rodenta:is there a Generic Model?. Springer New York. Col: Chemical Signals in Vertebrates 11. [S.l.: s.n.] Outubro de 2007. ISBN 978-0-387-73944-1 
  6. a b Wade, Nicholas (31 de maio de 2007). «Genome of DNA Pioneer Is Deciphered». New York Times. Consultado em 21 de fevereiro de 2009 
  7. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT, Gomes X, Tartaro K, Niazi F, Turcotte CL, Irzyk GP, Lupski JR, Chinault C, Song XZ, Liu Y, Yuan Y, Nazareth L, Qin X, Muzny DM, Margulies M, Weinstock GM, Gibbs RA, Rothberg JM (2008). «The complete genome of an individual by massively parallel DNA sequencing». Nature. 452: 872–6. Bibcode:2008Natur.452..872W. PMID 18421352. doi:10.1038/nature06884Acessível livremente 
  8. Flicek P, Aken BL, Beal K; et al. «Ensembl 2008». Nucleic Acids Res. 36: D707–14. PMC 2238821Acessível livremente. PMID 18000006. doi:10.1093/nar/gkm988 
  9. NCBI. «GRCh38 - hg38 - Genome - Assembly - NCBI». ncbi.nlm.nih.gov. Consultado em 15 de março de 2019 
  10. Jain. «Nanopore sequencing and assembly of a human genome with ultra-long reads». Nature Biotechnology (em inglês). 36: 338–345. ISSN 1546-1696. PMC 5889714Acessível livremente. PMID 29431738. doi:10.1038/nbt.4060 
  11. Scherer, Stewart (2008). A short guide to the human genome. CSHL Press. [S.l.: s.n.] ISBN 978-0-87969-791-4 
  12. «Is it time to change the reference genome?». Genome Biology. 20. doi:10.1186/s13059-019-1774-4Acessível livremente 
  13. «Limitations of the Human Reference Genome for Personalized Genomics». PLoS ONE. 7: e40294. doi:10.1371/journal.pone.0040294Acessível livremente 
  14. https://www.internationalgenome.org/home
  15. a b «UCSC Genome Bioinformatics: FAQ». genome.ucsc.edu. Consultado em 18 de agosto de 2016 

Ligações externas[editar | editar código-fonte]