Ocenjuje se, da lahko človeško telo vsebuje več kot dva milijona beljakovin, ki jih kodira le 20,000 do 25,000 genov. Skupno število, ki ga najdemo v bioloških organizmih terana, bo verjetno preseglo deset milijonov, vendar nihče ne ve zagotovo. Podatki so na voljo za nekaj več kot milijon od njih, vzeti so predvsem iz informacij, najdenih v več kot 100 genomih, ki so bili v celoti sekvencirani.
Področje, ki analizira beljakovine na splošno in želi izčrpno opisati vse tiste v človeškem telesu, se imenuje proteomika. Mnogi vidijo, da je naslednji logičen korak po zaključku projekta Človeški genom začetek projekta Human Proteome. Organizacija Human Proteome je bila ustanovljena za ta cilj.
Beljakovine so dolge molekularne verige, sestavljene iz 20 osnovnih gradnikov življenja, aminokislin. Najdaljši znani titin, znan tudi kot konektin, vsebuje 26,926 aminokislin. Titin se nahaja v mišicah in prispeva k njihovi pasivni togosti. Ker je 20 aminokislin mogoče povezati v poljubnih zaporedjih, je celoten prostor možnih beljakovin eksponenten, z vrednostjo približno 2050,000 – ogromno število. V tem prostoru lahko obstajajo zdravila za vsako bolezen ali bolezen, vendar je njihovo lociranje v tako velikem številu velik računalniški in teoretični izziv.
Beseda beljakovina izvira iz grščine prota, kar pomeni »prvenstvenega pomena«. To je primerno ime, saj njihovega osrednjega pomena v človeškem telesu ni mogoče preceniti. Vse biološke organizme lahko v osnovi razumemo kot beljakovinske strukture, napolnjene z vodo in včasih podprte z mineraliziranimi tkivi, imenovanimi kost. Za skoraj vsakega se najde še en, ki ga lahko pokvari. Včasih se združijo v medsebojno kooperativne enote, imenovane kompleksi, ki opravljajo uporabne biološke funkcije. Vsak del uporabnih genetskih informacij, ki jih najdemo v DNK in nekaj RNA, kodira ustrezno beljakovino, ki opravlja uporabno biološko vlogo.