刘广委员:加强贫困地区美术教师队伍建设 让山区孩子也有出彩机会
National Center for Biotechnology Information | |
---|---|
![]() Logo NCBI | |
![]() | |
Vznik | 4. listopadu 1988 |
Sídlo | Maryland Route 355 8600, Bethesda, 208 94, Spojené státy americké |
Sou?adnice | 38°59′45″ s. ?., 77°5′56″ z. d. |
Mate?ská organizace | United States National Library of Medicine |
Oficiální web | www |
![]() | |
Některá data mohou pocházet z datové polo?ky. |
National Center for Biotechnology Information (NCBI) neboli Národní centrum pro biotechnologické informace je sou?ástí Národní léka?ské knihovny USA v areálu americké agentury National Institutes of Health (NIH, Národní zdravotní instituty). Centrum bylo zalo?eno v roce 1988 a sídlí v areálu NIH v Bethesdě v Marylandu. ?editelem NCBI byl v minulosti David Lipman, známy svou ú?astí na vyzkumu technologie BLAST, u?ívané k sekvenaci DNA. V sou?asnosti instituci vede Stephen Sherry, v minulosti ?ídící vyvoj genetickych databází NCBI.[1]
úlohou NCBI je ukládání, zpracování a anotace vědeckych dat, zejména z oblastí molekulární biologie, medicíny, biochemie a genetiky. Instituce se také aktivně podílí na vyvíjení nástroj? pro analyzu bioinformatickych dat. V databázích NCBI se soust?e?ují vysledky sekvenací DNA (GenBank), vědecké ?lánky (PubMed Central, PubMed), informace o genech (RefSeq, Gene), anotace sekvencí makromolekul (Protein, Nucleotide) nebo mapovací data ji? osekvenovanych genom? (Genome). Slu?by NCBI jsou volně dostupné, podobně jako u bioinformatickych institut? jako European Bioinformatics Institute (EBI), Swiss Institute of Bioinformatics (SIB) nebo DNA Data Bank of Japan (DDBJ).
Pro tvorbu svych databází vyu?ívá NCBI data ukládané vědeckou komunitou manuálně p?ímo do NCBI nebo získávané jejich vyměnou se sp?ízněnymi institucemi jako nap?. DDBJ, European Molecular Biology Laboratory (EMBL), Protein Information Resource (PIR) nebo vydavateli vědecké literatury. Minoritní podíl na zisku dat tvo?í také cílené správcovské aktivity NCBI, data aktivně vkládaná zaměstnanci centra. Mno?ství ulo?enych dat v NCBI roste exponenciálně - v roce 2020 bylo ve v?ech databázích NCBI celkově ulo?enych p?es 3 miliardy záznam?,[2] v porovnání s p?ibli?ně 680 miliony záznamy v roce 2012[3] a 90 miliony záznamy v roce 2007.[4] Slu?by NCBI jsou denně vyu?ívány a? 4 miliony pou?ivatel?.[5]
Prohledávání NCBI je zprost?edkováno systémem Entrez, kterého vystupem je komplexní záznam získany z více propojenych databází. NCBI také umo?ňuje prohledávání svych databází za ú?elem nalezení podobnych sekvenci pomocí algoritmu Basic Local Aligment Search Tool (BLAST). Pro sta?ení v?ech relevantních dat p?irazenych k danému databázovému záznamu slou?í The Entrez Programming Utilities (E-utilities).
Basic Local Alignment Search Tool (BLAST)
[editovat | editovat zdroj]BLAST je algoritmus ur?eny pro vyhledávání podobnych sekvenci mezi ulo?enymi (nukleotidovymi nebo proteinovymi) sekvencemi. P?i prohledávání NCBI pomocí BLAST je mo?né pou?ít r?zné vstupní parametry (nap?. skórovací tabulka, prohledávaná databáze) podle p?edem po?adovanych kritérií. Vystupní sekvence jsou se?azené dle statistické vyznamnosti nalezené shody. BLAST m??e byt také vyu?ity pro ur?ení funk?ních a evolu?ních vztah? mezi sekvencemi nebo pro nalezení homologních ?len? stejné genové rodiny. V NCBI se nachází více verzí BLAST, které umo?ňují prohledávat p?íbuzné nukleotidové sekvence (BLASTN), proteinové sekvence (BLASTP), proteinové sekvence z vychozí translatované nukleotidové sekvence (BLASTX), translatované nukleotidové sekvence z vychozí sekvence proteinu (TBLASTN) nebo translatované nukleotidové sekvence z vychozí translatované nukleotidové sekvence (TBLASTX).
GenBank
[editovat | editovat zdroj]GenBank je databáze genetickych sekvencí obsahující anotovanou sbírku DNA sekvencí. GenBank je spolu s DNA Data Bank of Japan a European Nucleotide Archive sou?ástí tzv. International Nucleotide Sequence Database Collaboration (INSDC), které aktivně spolupracují na archivaci nukleotidovych sekvencí. Mezi těmito institucemi také dochází k vzájemné vyměně ulo?enych dat na denní báze. Nové vydání GenBank vychází pr?bě?ně v dvouměsí?ních intervalech zve?ejněním na stránce ftp. Jednotlivé záznamy v GenBank jsou katalogizované pod unikátním ?estimístnym ?íslem a obsahují údaje jako zdrojovy organismus, stru?ny popis k dané sekvenci, délka a typ sekvence, po?adí nukleotid? ve formátu FASTA a také bibliograficky záznam.[6]
PubMed
[editovat | editovat zdroj]PubMed je nástroj pro prohledávání vědecké literatury, ulo?ené v bibliografické databázi MEDLINE s obsahem p?es 32 miliónu citaci a abstrakt? z více ne? 5200 vědeckych ?asopis?.[7] Rozhraní PubMed umo?ňuje komplexní prohledávání vědeckych prací a poskytuje externí odkazy na plné texty a stránky publikací. Vybrané volné publikace jsou taky dostupné v archivu PubMed Central (PMC), ktery obsahuje p?es 6 milion? plnych text? zejména z biomedicinské a biologické oblasti vyzkumu. PubMed je jako databáze ve?ejnosti p?ístupna od roku 1996. Reference v PubMed jsou automaticky p?evzaté prost?ednictvím MEDLINE z vybranych ?asopis?, je? jsou pr?bě?ně aktualizovaná komisí Literature Selection Technical Review Committee (LSTRC).
Reference Sequence (RefSeq)
[editovat | editovat zdroj]Databáze RefSeq shroma??uje sekvence genomovych DNA, jejich transkript? a protein? za ú?elem tvorby rozsáhlé neredundantní sbírky integrující sekven?ní, genetické a funk?ní informace v jednom záznamu.[8] Záznamy v RefSeq vycházejí z archivu INSDC, její? sou?ástí je i GenBank, p?evzatá data jsou automaticky anotovaná a postupně validovaná správci databáze. Data do RefSeq jsou v men?í mí?e získávané také v rámci spolupráce s projekty jako Saccharomyces Genome Database nebo The Arabidopsis Information Resource. Unikátní identifika?ní ?íslo jednotlivych záznam? je dynamické a li?í se v závislosti na typu sekvence a mno?ství validovanych údaj? o dané sekvenci.
Gene
[editovat | editovat zdroj]Gene je databází organizující data specifické pro geny. Na rozdíl od RefSeq jsou do databáze zahrnovány pouze geny z ji? osekvenovanych genom? nebo které jsou p?edmětem aktivního vyzkumu. V?echny záznamy v Gene mají p?iděleny unikátní identifikátor GeneID. Obsahem záznamu jsou nomenklatura genu, jeho lokalizace v rámci genomu, genové produkty a jejich vlastnosti, expresní informace, markery, informace o fenotypu, nukleotidová sekvence, známé homology, proteinové domény a bibliografická data.[9]
Genome
[editovat | editovat zdroj]V databázi Genome se nachází sekven?ní a mapovací data ji? osekvenovanych nebo pr?bě?ně sekvenovanych genom?. Obsahuje informace o genomech z p?es 1000 r?znych druh? nebo kmen?, ze v?ech domén organism?. Genome zahrnuje sekvence nukleotid? genom?, mapy genetickych marker?, variace (nap?. jednonukleotidové polymorfismy) a údaje z epigenomickych studií. Vzhledem na p?irozenou velikost a komplexnost genomovych dat jsou záznamy ?leněné na jednotlivé chromozomy s unikátními RefSeq identifikátory. K prohlí?ení záznam? eukaryotickych genom? ulo?enych v Genome je mo?né pou?ít rozhraní online prohlí?e?e Genome Data Viewer, umístěného na webové stránce NCBI.[10]
Reference
[editovat | editovat zdroj]V tomto ?lánku byl pou?it p?eklad textu z ?lánku National Center for Biotechnology Information na anglické Wikipedii.
- ↑ Stephen Sherry, PhD, Selected as Acting Director, National Center for Biotechnology Information, National Library of Medicine. www.nlm.nih.gov [online]. [cit. 2025-08-04]. Dostupné online.
- ↑ SAYERS, Eric W; BECK, Jeffrey; BOLTON, Evan E. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 2025-08-04, ro?. 49, ?ís. D1, s. D10–D17. Dostupné online [cit. 2025-08-04]. ISSN 0305-1048. doi:10.1093/nar/gkaa892. PMID 33095870.
- ↑ Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 2013-1, ro?. 41, ?ís. Database issue, s. D8–D20. PMID: 23193264 PMCID: PMC3531099. Dostupné online [cit. 2025-08-04]. ISSN 0305-1048. doi:10.1093/nar/gks1189. PMID 23193264.
- ↑ WHEELER, David L.; BARRETT, Tanya; BENSON, Dennis A. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 2007-1, ro?. 35, ?ís. Database issue, s. D5–D12. PMID: 17170002 PMCID: PMC1781113. Dostupné online [cit. 2025-08-04]. ISSN 0305-1048. doi:10.1093/nar/gkl1031. PMID 17170002.
- ↑ NCBI Web Server Stats. www.ncbi.nlm.nih.gov [online]. [cit. 2025-08-04]. Dostupné online.
- ↑ BENSON, Dennis A.; CAVANAUGH, Mark; CLARK, Karen. GenBank. Nucleic Acids Research. 2025-08-04, ro?. 41, ?ís. D1, s. D36–D42. Dostupné online [cit. 2025-08-04]. ISSN 0305-1048. doi:10.1093/nar/gks1195. PMID 23193287. (anglicky)
- ↑ 2020 MEDLINE/PubMed Baseline: 30,420,660 Citations Found. www.nlm.nih.gov [online]. [cit. 2025-08-04]. Dostupné online.
- ↑ The Reference Sequence (RefSeq) Database - The NCBI Handbook
- ↑ MAGLOTT, D.; OSTELL, J.; PRUITT, K. D. Entrez Gene: gene-centered information at NCBI. Nucleic Acids Research. 2025-08-04, ro?. 39, ?ís. Database, s. D52–D57. Dostupné online [cit. 2025-08-04]. ISSN 0305-1048. doi:10.1093/nar/gkq1237. PMID 21115458. (anglicky)
- ↑ Genome Data Viewer - NCBI
Externí odkazy
[editovat | editovat zdroj]Obrázky, zvuky ?i videa k tématu National Center for Biotechnology Information na Wikimedia Commons
- Oficiální stránky (anglicky)
- NCBI Seznam knih
- PubMed centrála