Genom je zbirka vsega genskega materiala, ki je prisoten v enem organizmu. Ker zaporedje in struktura tega genskega materiala poganjata celotno biološko življenje, znanstveniki zelo zanimajo, čemu so namenjeni. Baza podatkov genoma je navzkrižno referencirana zbirka informacij o enem ali več organizmih, tako da lahko en znanstvenik pogleda vse razpoložljive genetske informacije, ki mu pomagajo pri raziskavah.
Genomi so zelo zapleteni in vsebujejo milijarde baz v zaporedju informacij. Računalniške baze podatkov so torej edini praktičen način organiziranja podrobnosti na enem mestu. Na splošno so na voljo kot spletne baze podatkov za znanstvene raziskave. Razmeroma novo področje znanosti, imenovano bioinformatika, se je pojavilo, da bi izpopolnilo način interpretacije bioloških podatkov prek računalniških sistemov.
Podatkovne baze genomov vsebujejo zaporedje genov organizma, če je znano celotno zaporedje. V nasprotnem primeru lahko vsebuje delna zaporedja. Genomi človeka, miši in muhe Drosophila so bili na primer sekvencirani. Ko je zaporedje genoma znano, lahko genetiki identificirajo določene gene v genomu. Vsak gen je list z navodili za en določen celični produkt.
Če ima gen mutacijo, ima zaporedje drugačno od normalnega funkcionalnega gena. Mutacije so lahko koristne in povzročijo koristno lastnost mutiranega organizma. Prav tako ne morejo vplivati na izdelek ali pa so lahko škodljive za normalno delovanje organizma. Številna zdravstvena stanja so na primer posledica mutacij v določenem genu.
Z mutacijami se lahko izračuna tudi, kako tesno je določena vrsta povezana z drugo, saj se sčasoma nabere več mutacij. Posamezniki se lahko razlikujejo tudi po zaporedju genoma, zlasti ker veliki deli genoma niso geni in ne kodirajo nobenega bistvenega celičnega produkta. Baza podatkov genoma vsebuje zaporedje iz organizma, ki je označen kot standard, vendar bo med poljubno izbranim standardom in drugimi posamezniki v vrsti veliko manjših razlik.
Kljub številnim razlikam so geni prepoznavni po zaporedjih. Če genetiki vedo, kaj določen gen počne v enem organizmu, potem gen s podobnim zaporedjem v drugi živali najverjetneje opravlja enako funkcijo. Genetiki lahko uporabijo genomsko bazo podatkov za identifikacijo gena, ki ga preučujejo, ali da ugotovijo, kaj gen počne.
Po vsaki bazi genomov je mogoče iskati. Običajno lahko znanstveniki iščejo bazo podatkov na več različnih načinov. Običajno lahko vnese zaporedje gena, ki ga je sekvenciral. Nato baza podatkov najde eno ali več podobnih zaporedij za primerjavo.
Enostavnejši način iskanja po bazi podatkov vključuje iskanje ključne besede gena, kot je ime gena. Organi, kot je ameriška nacionalna agencija za biotehnološke informacije (NCBI), lahko dajo sekvencam različne referenčne številke, genetik pa lahko išče tudi bazo genomov z uporabo enega od teh identifikatorjev. On ali ona lahko tudi zoži rezultate z uporabo več parametrov iskanja. Navzkrižne informacije so značilnost večine zbirk podatkov o genomih, rezultat enega samega zaporedja pa bo uporabniku baze podatkov zagotovil tudi uporabne povezave za več genetskih informacij. Poleg informacij o določenem zaporedju številne baze podatkov zagotavljajo vizualno predstavo zaporedja in pomembnih značilnosti tega območja.
Različni organizmi imajo lahko specifične baze genomov, vendar nekatere večje baze podatkov vsebujejo več kot eno vrsto. Različni organi nadzorujejo različne baze podatkov, ki so na voljo, tako da lahko vse zbirke uporabljajo različne oblike in zmožnosti iskanja. Nekateri primeri teh organov vključujejo NCBI, Evropski bioinformatični inštitut ali celo posamezne univerze.