Sestavljanje genoma se nanaša na proces jemanja številnih majhnih koščkov genetskega zaporedja in njihovega združevanja v koherentno celoto, ki predstavlja celoten genom organizma. To je glavni poudarek področja bioinformatike in v ta namen obstajajo različni projekti genoma. Sestavljanje genoma je bilo uporabljeno za začetek analize genomov številnih vrst, vključno z ljudmi, rastlinami, živalmi in bakterijami.
Analiza genov organizma je dolg proces, sestavljanje genoma pa je eden prvih korakov. Številne druge analizne metode temeljijo na uspešnem sestavljanju in identifikacija genov brez tega ne more napredovati. Še preden se geni najdejo, lahko uspešna sestava genoma ustvari veliko koristnih informacij za kasnejšo analizo, vključno z velikostjo genoma, njegovo strukturo in njegovo splošno sestavo.
Postopek sestavljanja genoma je podoben sestavljanju sestavljanke, ne da bi imeli za vodilo sliko ali uporabne oblike. Ko se soočimo s prvimi deli genoma, imenovanimi surovo branje, je le redkokdaj znak, kam gre določen del ali celo kako je usmerjen. Vsak kos je podobno kodiran s štirimi bazami DNK, skrajšanimi A, C, G in T. Genom bi lahko stisnil v en velik kromosom ali razdelil na več. Prav tako ni nobenega zagotovila, da nekateri neobdelani odčitki niso dvojniki istega območja genoma, kar bi pomenilo, da obstaja manj edinstvenih informacij, kot se zdi na prvi pogled.
Splošno poznavanje strukture genoma je neprecenljivo pri začetku procesa sestavljanja. Čeprav so genomi med vrstami izrazito različni, obstajajo določena pravila, ki jim sledijo določene vrste genoma, ki jih je mogoče uporabiti pri sestavljanju drugega genoma iste vrste. Na primer, če ima določena vrsta organizma vedno določen vzorec v bližini, kjer se nahajajo geni, bi lahko pri sestavljanju drugega podobnega organizma razumno domnevali, da bi odkrivanje takega vzorca signaliziralo gen v bližini. V večjem obsegu ima veliko bakterijskih genomov en kromosom, zato bi bilo smiselno predvideti, da bi se vsi neobdelani odčitki nove bakterije nekako ujemali na enem kromosomu. Uporaba splošnega genetskega znanja na ta način lahko raziskovalcu omogoči, da začne razumeti potencialno sto tisoče podatkov.
Obstaja veliko drugih metod, ki se lahko uporabljajo pri sestavljanju genoma, vključno z računalniškimi napovedmi in ročnimi primerjavami. Ne glede na metodo je sestavljanje genoma veliko delo, ki je pogosto dolgotrajno in težko. Ker je osnova za številne prihodnje genetske analize organizma, je malo prostora za napake.